Hoe de Similarity Factor Bereken in in PHP Documents

Als u gebruikers in staat om content te uploaden naar uw website, geplagieerd inhoud vangen bezuinigingen op uw kosten voor de opslag van gestolen voorwerpen en tekst. U kunt PHP gebruiken om de inhoud te beoordelen en terug te keren een percentage dat de gelijkenis factor vormt voor twee URL's. Hiermee kunt u kruipen websites en vergelijking van twee URL's met elkaar om uit te vinden of de inhoud één pagina is vergelijkbaar met de inhoud van een andere URL.

instructies

1 Open uw PHP editor en de broncode bestand dat u wilt gebruiken om de URL's doorzoeken en te vergelijken vergelijkbare inhoud.

2 Maak twee URL-variabelen en het opzetten van een derde variabele die het aantal tekens die passen in de twee pagina's terug. De volgende code stelt de variabelen:

$ Url1 = '';
$ Url2 = '';
$ Zelfde = 0;

3 Verkrijgen, de inhoud van de twee URL. De volgende code initialiseert en haalt de inhoud voor twee URL's:

$ Curl = curl_init ();

curl_setopt ($curl, CURLOPT_URL,$url1);

$ INHOUD 1 = curl_exec ($ curl);
curl_setopt ($ krul, CURLOPT_URL, $ url2);
$ Contents2 = curl_exec ($ curl);

4 Vergelijk de twee URL inhoud snaren. De volgende code geeft het aantal opeenvolgende karakters van "$ materiaal1" die overeenkomen met de inhoud in "$ contents2":

$ Soortgelijke = strstr ($ contents2, $ materiaal1);
$ Similarcount = strlen ($ vergelijkbaar);

5 Verdeel de "$ similarcount" waarde door de totale lengte van de string van de "$ materiaal1." Dit nummer geeft u de gelijkenis factor of het percentage van vergelijkbare inhoud die past bij uw oorspronkelijke URL. Gebruik de volgende code om de factor te berekenen:

$ Factor = $ similarcount / (strlen ($ contents2));
echo $ factor;