Google Safe Browsing API con PHP, filtra las urls potencialmente peligrosas

Preparando un pequeño nuevo proyecto del que os hablaré en mi siguiente artículo, tuve un problema que me llevó a escribir este otro. En un momento de la aplicación el usuario debe escribir una url (el resto es secreto aún :P). Pues bien, ya durante las pruebas aparecieron los típicos graciosos que utilizan url’s potencialmente peligros, de esas que no hacen cosas nada buenas. Buscando un poco dí con Google Safe Browsing API, el sistema que Google pone a nuestra disposición para comprobar contra sus sistemas si tienen una determinada url recogida dentro de su base de datos de urls peligrosas, la misma que utilizan ellos para lanzar a veces esos avisos de “¿seguro que quieres ver esto?”.

Esta API funciona de modo diferente a la mayoría de aplicaciones de Google que residen directamente en la nube y lanzamos consultas contra su API. En este caso nos provee de su base de datos de urls potencialmente peligrosas para que las guardemos localmente y hagamos las consultas directamente en nuestros sistemas, lo único que debemos hacer es actualizar periódicamente esos datos, eso sí, con algunas limitaciones que nos impone Google, como que no se pueden renovar en intervalos inferiores a 30 minutos. Actualmente esta base de datos tiene más de trescientos mil registros.

Vamos a explicar como utilizarla. Lo primero que debemos hacer es, como en todo lo que hace Google, crear una “API KEY” y una sencilla tabla en nuestro servidor MySQL donde alojaremos la información que nos envíe Google.

  1. CREATE TABLE IF NOT EXISTS `malware` (
  2. `malware_hash` varchar(32) NOT NULL,
  3. PRIMARY KEY  (`malware_hash`)
  4. ) ENGINE=MyISAM DEFAULT CHARSET=latin1;

Creamos ahora una tarea que se ejecutará periódicamente y que leerá, siguiendo las especificaciones adecuadas, los datos que devuelve Google y los insertará/eliminará de nuestra base de datos. Yo, como ya he comentado en otras ocasiones, utilizo Adodb para el acceso a datos.

  1. include(dirname(dirname(__FILE__))."/includes/funciones.inc.php");
  2.  
  3. $api_key = "TU KEY";
  4. $google_url = "http://sb.google.com/safebrowsing/update";
  5.  
  6. //open the remote URL
  7. $target = "$google_url?client=api&apikey=$api_key&version=goog-malware-hash:1:-1,goog-black-hash:1:-1";
  8.  
  9. $handle = fopen("$target", ‘r’)
  10.     or die("Couldn’t open file handle " . $target);
  11. if ($handle) {
  12.     while (!feof($handle)) {
  13.         $line = fgets($handle);
  14.         if (substr($line,0,1) != ‘[‘) {
  15.             $operation = (substr($line,0,1)); //get the ‘+’ or ‘-’
  16.             $hash = trim(substr($line,1)); //get the md5 hash
  17.             $hash = qstr($hash); //escape
  18.             if ($operation == ‘+’){
  19.                 $sql = "insert ignore into malware (malware_hash) VALUES (‘".$hash."’)";
  20.                 $conn->Execute($sql);
  21.             }else{
  22.                 $sql = "delete from malware where malware_hash = ‘".$hash."’";
  23.                 $conn->Execute($sql);
  24.             }
  25.         }
  26.     }
  27.     fclose($handle);
  28. }

Lo que hacemos simplemente es eliminar los hash que nos indica que debemos quitar y añadir los nuevos. Vamos a probar el sistema. Utilicé varias clases y sistemas que había por ahí para utilizar con PHP pero ninguno me parecía lo suficientemente completo hasta que encontré este. Su funcionamiento es muy sencillo. De nuevo está hecho usando Adodb, cámbialo según tus requerimientos.

  1. $class = new GoogleSafeBrowsing(‘tu_key’, true);
  2. $safe=$class->lookupsFor("http://blog.osusnet.com");

Nos devolverá un booleano que indica si la url es segura o no. Si probamos con alguna de éstas obtendremos un bonito false :). Espero que os sirva.

5 comentarios en “Google Safe Browsing API con PHP, filtra las urls potencialmente peligrosas

  1. Muy interesante el articulo, justamente hoy estuve limpiando un sitio de un cliente que estaba marcado como malicioso.
    podes volver a subir la clase que comentas ya que el enlace no anda.
    saludos

  2. Hola, se que es un post viejo, pero no me funciona bien, tengo una url que esta denunciada como web pishing, pero al pasarla en la clase no me la detecta como tal. y firefox si la detecta. Que puede estar pasando?¿

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>