php 爬蟲

這篇是用php的方式去抓網頁程式碼,可以把想要的資訊用下載程式碼的方式,拿下來整理又可達到即時的效果

 <?php
    header("Content-Type:text/html; charset=utf-8");
    require_once('simple_html_dom.php');
    $html2 = file_get_html('https://www.youtube.com/results?search_query=好好的');
    $myfile = fopen("f3.txt", "w") or die("Unable to open file!");  
    foreach($html2->find('a') as $element) {
      echo $element->href . "'<br>'";
      fwrite($myfile,$element);
    }
  fclose($myfile);
?>

第一行是解決文字亂碼的問題
第二行是引入別人寫好的函示庫
file_get_html:它的功能是給網址就會把全部程式碼載下來,可以先放到變數裡再做處理
fopenphp處理檔案的方式,目前是設定寫入模式
這邊的foreach用意是把整個網頁的程式碼只塞選連結a的href後面的程式碼,抓出來後寫入檔案

結果:

python爬蟲