Table des matières
Niveau
..........
En rapport...

Google PageRank

Nombreux sont les site à proposé de calculer votre PR, mais tres peu vous donne les fonctions a utliser pour le faire.

La classe ci-dessous va vous permetre de calculer votre PR tres facilement.

Utilisation

Voici un exemple d'appel a la classe de calcul du pr :

php
$pr=new GooglePR();
echo "Le PageRank est: <br>";
 
//calcule le PR pour tous les datacenters référencé
$r=$pr->getAllRank("http://www.wikistuce.info");
print_r($r);
 
 
//calcule le PR pour tous le 1er datacenter de la liste (google.com par defaut)
$r=$pr->getRank("http://www.wikistuce.info");
print_r($r);

Retour

La fonction de calcul renvoie un tableau structuré comme ceci :
$tableau[NOM_DU_DATACENTER]=PAGERANK
exemple de retour :

Array
(
    [google.com] => 4
    [toolbarqueries.google.com] => 4
    [google.fr] => 4
    [toolbarqueries.google.fr] => 4
    [google.de] => 4
    [toolbarqueries.google.de] => 4
)

Code

php
<?php
class GooglePR {
	/*
	GooglePR : adaption par iDo [ido@wikistuce.info]
 
	Script de départ : http://www.phpsources.org/scripts162-PHP.htm	
	*/
 
	function GooglePR() {
		$this->GOOGLE_MAGIC=0xE6359A60;
		$this->DC=array('google.com',"toolbarqueries.google.com","google.fr","toolbarqueries.google.fr","google.de","toolbarqueries.google.de");
		}
	function _zeroFill($a, $b) {
		$z = hexdec(80000000);
		if ($z & $a) {
			$a = ($a>>1);
			$a &= (~$z);
			$a |= 0x40000000;
			$a = ($a>>($b-1));
		}
		else
			$a = ($a>>$b);
		return $a;
	}
	//Cette fonction est utilisée pour le calcul du checksum de Google
	function _mix($a, $b, $c) {
		$a -= $b;
		$a -= $c;
		$a ^= ($this->_zeroFill($c,13));
		$b -= $c;
		$b -= $a;
		$b ^= ($a<<8);
		$c -= $a;
		$c -= $b;
		$c ^= ($this->_zeroFill($b,13));
		$a -= $b;
		$a -= $c;
		$a ^= ($this->_zeroFill($c,12));
		$b -= $c;
		$b -= $a;
		$b ^= ($a<<16);
		$c -= $a;
		$c -= $b;
		$c ^= ($this->_zeroFill($b,5));
		$a -= $b;
		$a -= $c;
		$a ^= ($this->_zeroFill($c,3));
		$b -= $c;
		$b -= $a;
		$b ^= ($a<<10);
		$c -= $a;
		$c -= $b;
		$c ^= ($this->_zeroFill($b,15));
		return array($a,$b,$c);
	}
	// Calcul le checksum de Google pour une URL donnée
	function _GoogleCH($url, $length=null, $init='') {
		if(is_null($length))
			$length = sizeof($url);
		$a = $b = 0x9E3779B9;
		$c = ($init!='')?$init:$this->GOOGLE_MAGIC;
		$k = 0;
		$len = $length;
		while($len >= 12) {
			$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));
			$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));
			$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));
			$mix = $this->_mix($a,$b,$c);
			$a = $mix[0];
			$b = $mix[1];
			$c = $mix[2];
			$k += 12;
			$len -= 12;
		}
		$c += $length;
		switch($len) {     /* Toute les cases retournent vraie */
			case 11: $c+=($url[$k+10]<<24);
			case 10: $c+=($url[$k+9]<<16);
			case 9 : $c+=($url[$k+8]<<8);
			/* Le premier byte de c est réservé pour la longueur */
			case 8 : $b+=($url[$k+7]<<24);
			case 7 : $b+=($url[$k+6]<<16);
			case 6 : $b+=($url[$k+5]<<8);
			case 5 : $b+=($url[$k+4]);
			case 4 : $a+=($url[$k+3]<<24);
			case 3 : $a+=($url[$k+2]<<16);
			case 2 : $a+=($url[$k+1]<<8);
			case 1 : $a+=($url[$k+0]);
			/* case 0: rien à additionner */
		}
		$mix = $this->_mix($a,$b,$c);
		return $mix[2];
	}
	// Converti une chaine dans le tableau d'entiers
	// contenant une valeur numérique de caractères
	function _strord($string) {
		for($i=0;$i<strlen($string);$i++)
			$result[$i] = ord($string{$i});
		return $result;
	}
	// Fonction utilisée pour obtenir la valeur du PageRank.
	function getrank($url, $prefix="info:", $datacenter='') {
		$datacenter=($datacenter=='')?$this->DC[0]:$datacenter;
		//Si $prefix est "info:", alors la Toolbar pagerank sera retourné.
		$url = $prefix.str_replace('http://','',strtolower($url));
		//Prend le checksum de Google pour $url utilisant la fonction $this->_GoogleCH.
		$ch = $this->_GoogleCH($this->_strord($url));
		$file="http://".$datacenter."/search?client=navclient-auto&ch=6".$ch."&features=Rank&q=".$url;
		//Prend le Crawl Date à la place du PageRank, change "&features=Rank"
		//pour "&features=Crawldate"
		//Pour obtenir le détail XML, remplacer "&features=Rank"
		$data = @file($file);
		//Si les données de Google sont indisponible, ou l'URL est
		//invalide, renvoie false.
		if(!$data || preg_match("/(.*)\.(.*)/i", $url)==0) return false;
		//La preg_match check est une URL basique validée que si elle est vérifiée
		//si l'URL a le même point.
		//Il y a deux lignes de retour chariot avant les données de la page Google.
		$rankarray = explode (":", $data[2]);
		//Enlève les caractères invisibles et les retours chariot.
		$rank = trim($rankarray[2]);
		//Renvoie false si il n'y a pas de rank.
		if($rank=="") return false;
		return array($datacenter => $rank);
	}
	function getAllRank($url,$prefix="info:") {
		$ret=array();
		foreach ($this->DC as $v) {
			$r=$this->getrank($url,$prefix,$v);
			$ret[$v]=$r[$v];
		}
		return $ret;
	}
}

iDo 10/04/2006 14:48