This is a translated page. The original can be found here: http://iwebdevel.com/2009/10/03/php-how-to-download-a-webpage-aka-web-scrapping-with-php-fsockopen-file_get_contents-curl-function-download-web-page/
UPDATES VIA RSS | Email Aktualizací přes RSS | E-mail Get updates via feedburner Get updates via twitter
Home / Coding / PHP / PHP: How to download a webpa… Home / Kódování / PHP / PHP: Jak stáhnout webpa ...

PHP: How to download a webpage (aka web scrapping) with PHP PHP: Jak stahovat webové stránky (také web sešrotování) s PHP

Posted on 03. Publikováno dne 03. Oct, 2009 by Dragos in Coding , PHP Října 2009 od Dragos v Kódování, PHP

There are many ways of downloading web pages, or web content. Existuje mnoho způsobů, jak stahovat z webových stránek či obsahu webových stránek. Personally I like to use cURL for my web scrapping needs, but sometimes I also use fsockopen and file_get_contents . Osobně rád používám pro mé potřeby cURL web sešrotování, ale někdy se také použít fsockopen a file_get_contents.

Here are 3 different functions that will allow you to download web content. Zde jsou 3 různých funkcí, které vám umožní stahovat obsah webových stránek.

cURL : cURL:

 function getData($url) { Funkce getdata ($ url) (
    if($url!='localhost' && $url!='http://localhost') { if ($ url! = 'localhost' & & $ url! = 'http://localhost') (
        $ch=curl_init(); $ ch = curl_init ();
        curl_setopt($ch, CURLOPT_URL, $url); curl_setopt ($ ch, CURLOPT_URL, $ url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); curl_setopt ($ ch, CURLOPT_RETURNTRANSFER, TRUE);
        curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/6.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.3"); curl_setopt ($ ch, CURLOPT_USERAGENT, "Mozilla/6.0 (compatible; Windows NT 5.1, en-US; rv: 1.9.0.1) Gecko/2008070208 Firefox/3.0.3");
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION,3); curl_setopt ($ ch, CURLOPT_FOLLOWLOCATION, 3);
        $result['data']=curl_exec($ch); $ result [ 'data'] = curl_exec ($ ch);
        $result['error']=curl_error($ch); $ result [ 'error'] = curl_error ($ ch);
        curl_close($ch); curl_close ($ ch);
        return $result; return $ result;
    } )
    else return $result['error']='err'; else return $ result [ 'error'] = 'err';
} ) 

fsockopen fsockopen

function getData($url) { $arr=parse_url($url); $fp = fsockopen($arr['host'], 80, $errno, $errstr, 30); if(!$fp) { return false; }else { // send headers $out = "GET ".fsockopen($arr['host'], 80, $errno, $errstr, 30)." HTTP/1.1\r\n"; $out .= "Host: ".str_replace('http://'.$arr['host'],'',$url)."\r\n"; $out .= "User-Agent: FSOCKOPEN\r\n"; $out .= "Connection: Close\r\n\r\n"; fwrite($fp, $out); while(!feof($fp)) { $contents .= fgets($fp, 4096); }; fclose($fp); return $contents; } } Funkce getdata ($ url) ($ arr = parse_url ($ url); $ fp = fsockopen ($ arr [ 'host'], 80, $ errno, $ errstr, 30); if ($ fp) (return false; ) else (/ / odeslání hlaviček $ out = "GET". fsockopen ($ arr [ 'host'], 80, $ errno, $ errstr, 30). "HTTP/1.1 \ r \ n"; $ out .= " Host: ". str_replace ( 'http://'. $ arr [ 'host'],'',$ URL)." \ r \ n "; $ out .=" User-Agent: fsockopen \ r \ n " $ out .= "Connection: Close \ r \ n \ r \ n"; fwrite ($ fp, $ out); while (! feof ($ fp)) ($ obsah .= fgets ($ fp, 4096); ); fclose ($ fp) return $ obsah;)) 

file_get_contents file_get_contents

 function getData($url) { Funkce getdata ($ url) (
return file_get_contents($url); návrat file_get_contents ($ url);
} ) 

As you see the easiest way of downloading web content is by using the file_get_contents function, but if you need more options, especially if you are working with the headers, then cURL is the best way to go for you. Jak vidíte, je nejjednodušší stahování obsahu webu je pomocí funkce file_get_contents, ale pokud potřebujete více možností, zvláště pokud pracujete s záhlaví, pak cURL je nejlepší cesta pro vás.

Translate this post Translate this post


Related posts: Související příspěvky:

  1. JavaScript: Send function as a parameter to another function (callbacks) JavaScript: Poslat funkci jako parametr jiné funkce (volání)

  • saya kemarin juga ngerjain web yang grabb data dari website lain... Me včera juga ngerjain web jang Grabb údajů dari stránkách ležel ...

    sayang ga sempat baca artikel ini, jadi nya pake file_get_contents().. Sayang ga sempat Baca artikel ini, Jadi nya pake file_get_contents () .. di potong2 pake preg_replace(), buat ngambil data yang di butuh kan... di potong2 pake preg_replace (), BUAT ngambil údaje jang di butuh kan ...


    btw salam kenal... btw Salam kenal ...
blog comments powered by Disqus blog připomínky powered by Disqus