Exploitons Google !

Posted on 10 mars 2010

5


Travaillant actuellement, pour un de mes cours, sur l’utilisation avancée de Google, ainsi que de ses URLs, pour en tirer un meilleur parti, j’ai pensé que l’information à ce propos pouvait intéresser plus de monde que mes quelques camarades de classe.

En voici donc un condensé…

Pour commencer

On peut se demander pourquoi s’intéresser aux URLs de Google. En effet, chacun sait utiliser Google — en tout cas selon les discours que l’on nous tient –. Les principaux intérêts que j’y trouve sont :

  1. Obtenir des résultats plus pertinents (encore que la notion de pertinence soit toujours aussi floue pour moi)
  2. Créer une Google Alert plus précise
  3. Créer un flux rss plus précis (avec un outil comme Yahoo!Pipes, par exemple)
  4. Sauvegarder une recherche personnalisée (possibilité de la partager, etc.)
  5. Connaître un peu plus l’outil que l’on utilise tous quotidiennement

Un exemple de base

Supposons une simple requête, avec le mot test : voici la requête que j’en retire :
http://www.google.fr/search?q=test&ie=utf-8&oe=utf-8&aq=t&rls=com.ubuntu:en-US:unofficial&client=firefox-a

De suite, on voit apparaître de nombreux codes, commençant tous par &.

&ie= et &oe= Correspond au codage en input et output
&rls= et &client= Identification du client

Déjà, on observe que les codes &rls= et &client= ne nous sont pas utiles. On peut les supprimer, sans changer les résultats.
Pour les changer, voici

Quelques codes utiles pour une requête

&q= ou &as_q= La requête en elle-même
&q=mot+mot+… Opérateur AND (recherche simple)
&q=mot+-mot ou &as_eq=mot Opérateur NOT
&q=mot+or+mot ou &q=mot+|+mot Opérateur OR
&q=mot|mot ou &as_oq=mot Idem
&q=related:URL ou as_rq=URL Sites associés à l’URL citée
&q= »mot+mot » ou &as_epq=mot+mot Expression exacte
&as_lq=URL Liens entrants
&as_filetype=extension précédé de &as_ft=i|e Inclut ou Exclut une extension de fichier
&as_sitesearch=URL précédé de &as_dt=i|e Inclut ou Exclut un site web
&as_occt=any|title|url|links Correspond aux allintitle, allinurl, etc.
&as_qdr=Y|M|W|D|N|S Page publiée, par an (Y), mois (M), semaine (W), jour (D), minute (N), seconde (S)

Ceci sont donc les codes « de base » pour effectuer une requête (liste sûrement non exhaustive, mais c’est toujours utile). On remarque déjà qu’il existe de nombreuses façons pour Google d’arriver au même résultat (ne fusse que pour l’opérateur OR, on compte 4 solutions possibles).
Par ailleurs, il est à noter que la dernière commande — &as_qdr= — permet d’affiner la recherche. Il est également possible d’être plus précis :
&as_qdr=M5 correspondra à une recherche sur les 5 derniers mois.

Paramétrage géographiques et linguistiques

À utiliser avec les codes des pays (issus de la norme ISO3166-1), comme FR, ES, NL, etc.

&hl=CODE Langue de l’interface
&lr=CODE Langue des résultats
&cr=countryCODE Pays d’origine des pages affichées

Quelques codes supplémentaires et très utiles

Pour paramétrer les résultats et leur affichage.

&pws=0 Suppression des résultats personnalisés
&btnG= Bouton de Recherche Google
&btnI= Bouton I am lucky (j’ai de la chance)
&newwindow=1 Ouvrira les résultats dans une nouvelle fenêtre
&start=NOMBRE Afficher les résultats à partir de la page numéro X
&num=NOMBRE Nombre de résultats affichés par page
&safe=on|off Activation/désactivation de la safesearch

Un exemple de requête

Pour illustrer tout cela, voici un exemple, toujours avec le mot test.
http://www.google.fr/search?q=test&as_ft=i&as_filetype=pdf&as_qdr=W8&safe=off&lr=FR&hl=NL&newwindow=1&pws=0
Ce qui nous donne une recherche du terme test en français, au format PDF, publié il y a moins de 8 semaines. L’interface d’affichage sera en néerlandais, les résultats s’afficheront dans une nouvelle page et les résultats personnalisés ainsi que la safesearch sont supprimés.

En conclusion

Voilà, l’objectif n’était pas d’être exhaustif (si vous avez d’autres codes, les commentaires sont les bienvenus !), mais j’espère que ceci pourra vous aider ou, à tout le moins, vous intéresser.
Bien que rébarbatif (pas pour moi, mais je suis root dans l’âme), l’utilisation des URLs accélèrent la rédaction des requêtes. Plutôt que devoir repasser par l’interface recherche avancée, il suffit de modifier la partie qui nous gène dans la requête. Enfin, le passage btnG= à btnI= facilite grandement l’utilisation du bouton I’m lucky.

PS : Désolé pour les tableaux, mais je n’ai pas trouvé de système d’affichage plus efficace.

Advertisements
Posted in: Google, Infodoc, Web