Recherche sur Internet


apprentissage des conventions de syntaxe généralesLes fonctions de recherche générale et élaborée utilisent les mêmes règles de syntaxe quant à la phraséologie, le respect de la classe et la recherche de mots connexes.

mots et phrasesDans AltaVista Search, un mot correspond à toute chaîne de lettres et de chiffres qui est séparée par Par exemple, AltaVista Search interprète et indexe HAL5000, 60258, www, http, et EasierSaidThanDone comme des mots simples car il s'agit de chaînes de caractères continues comprises entre des caractères qui ne sont ni des lettres ni des chiffres. Que les mots figurent dans un dictionnaire ou qu'ils soient orthographiés correctement, le logiciel indexe tous les mots qu'il trouve sur une page Web.

Recherche de phrases

AltaVista Search vous permet également de rechercher des phrases ou des groupes de mots connexes qui se suivent. Pour former une phrase dans une requête de recherche, entrez les mots entre guillemets. Ainsi, AltaVista Search effectue la recherche sur l'ensemble de la phrase et non sur chaque mot de cette dernière. Pour rechercher par exemple la phrase politiques du personnel, entrez
"politiques du personnel"
Si vous n'avez pas utilisé les guillemets, AltaVista Search trouve d'une part des occurrences du mot « personnel » et d'autre part des occurrences du mot « politiques », ainsi que toute autre occurrence où ces deux mots apparaissent ensemble. Lorsque des mots sont compris entre guillemets, la recherche porte uniquement sur l'ensemble de ces deux mots (ou phrase).

Ponctuation

AltaVista Search ne prend pas en compte la ponctuation sauf lorsqu'il s'agit de l'interpréter comme un séparateur de mots. Vous pouvez également former une phrase en entrant une ponctuation ou des caractères spéciaux entre chaque mot, et ce sans espace entre les caractères et les mots. Ainsi, la ponctuation peut être très utile lorsque vous recherchez un numéro de téléphone. Par exemple, il est plus facile d'entrer
1-800-555-1212
que « 1 800 555 1212 », cette syntaxe étant tout aussi acceptable mais moins habituelle. Les mots à trait d'union, comme CD-ROM, constituent automatiquement une phrase, en raison du trait d'union.

Nous vous recommandons cependant d'utiliser les guillemets. En effet, si vous entrez une ponctuation ou des caractères spéciaux entre chaque mot, certains caractères spéciaux peuvent avoir d'autres significations :

Respect de la casse

Le respect des majuscules et des minuscules dans une recherche dépend de la casse utilisée dans votre requête.

Caractères multinationaux

AltaVista Search prend en charge les recherches d'occurrences exactes pour les caractères appartenant au jeu de caractères ISO Latin-1. Autrement dit, vous pouvez entrer un mot avec des lettres accentuées ou affecté d'autres signes diacritiques. AltaVista Search trouvera alors uniquement les documents où figure ce mot tel qu'il est orthographié dans la requête.

Par exemple, si vous recherchez le mot éléphant, AltaVista Search trouvera uniquement les documents où ce mot est orthographié comme indiqué dans la requête.

Si vous entrez un mot comportant une majuscule accentuée, (par exemple, Éléphant), le résultat de la recherche correspondra uniquement au mot tel qu'il a été entré.

Si vous n'entrez pas les accents et autres signes diacritiques dans la requête de la recherche, les documents trouvés par AltaVista Search comprennent des mots comportant ou ne comportant pas ces signes spéciaux. Pour les recherches de mots en anglais, cette caractéristique donne des résultats non pertinents. Cependant, pour toutes les autres langues, celle-ci permet aux utilisateurs d'entrer des requêtes, même si leur clavier ne prend pas en charge le jeu de caractères internationaux.

Pour prendre en charge la recherche de caractères spéciaux sans leurs signes diacritiques, AltaVista Search établit une correspondance avec la combinaison de caractères ou le caractère simple le plus proche. Le logiciel indexe alors les mots en conservant les deux formats : avec les caractères spéciaux tels qu'ils apparaissent et avec les caractères spéciaux remplacés par leurs équivalents. Le tableau suivant répertorie les caractères spéciaux et leurs équivalents :
Caractère(s) Equivalent Caractère(s) Equivalent
Æ AE æ  ae
Á Â À Å Ã Ä A á â à å ã ä a
Ç C ç  c
D d
É Ê È Ë  E é ê è ë  e
Í Î Ì Ï  I í î ì ï  i
Ñ  N ñ  n
Ó Ô Ò Ø Õ Ö O ó ô ò ø õ ö o
TH th
Ú Û Ù Ü  U ú û ù ü  u
Y ? ÿ y
ß ss

Recherche de mots connexes

Vous pouvez utiliser la notation du caractère générique « astérisque » ( * ) pour rechercher un groupe de mots contenant le même motif. Cela s'avère très utile si vous souhaitez rechercher des dérivés ou des variantes orthographiques d'un même mot.

Par exemple, pour rechercher le mot chanter et tous ses dérivés, tels que chanteur, chanteurs et chanson, entrez chanter* dans le champ réservé à l'entrée de la requête. Si vous entrez cantalo*, vous trouverez des correspondances pour cantaloup, cantaloupe, cantalope, et leurs pluriels.

Remarques

Cet exemple de message indique que plus de quatre millions de mots dans l'index commencent par « inte ». AltaVista Search n'affiche donc aucun résultat car la requête n'est pas assez précise pour aboutir à un résultat exploitable. 

Choix entre recherche générale ou recherche élaborée

Les interfaces de recherche générale et élaborée sont tout aussi puissantes et flexibles l'une que l'autre. Quant à la difficulté d'utilisation, la différence est minime. L'interface de recherche générale présente les avantages suivants : L'interface de recherche élaborée exige une syntaxe logique et plus précise qui, bien que plus exigeante, vous permet d'affiner les résultats de votre recherche. Reprenons l'exemple du flan aux pommes et aux poires. Vous souhaitez maintenant afficher uniquement les documents comprenant au moins les mots flan et recette. La syntaxe de la recherche élaborée est alors plus précise que celle de la recherche générale : (pomme OR poire) AND flan AND recette.

Dans l'interface de recherche élaborée, vous pouvez entrer vos propres règles de classement, mais cela n'est pas obligatoire. Si vous n'entrez aucune règle, AltaVista affiche les résultats dans un ordre quelconque.

Bien que ces deux interfaces proposent quasiment les mêmes fonctions, la recherche élaborée comporte quelques fonctions supplémentaires :

Pour obtenir de plus amples informations sur l'utilisation de l'interface de recherche élaborée, reportez-vous à la section Recherche élaborée.

Recherche générale

Dans les recherches générales, les règles de syntaxe générales s'appliquent à la phraséologie, au respect de la casse et à l'utilisation de l'astérisque (*) comme caractère générique. De plus, vous pouvez affiner votre recherche à l'aide des deux opérateurs suivants :
Opérateur Fonction
+ Inclut uniquement dans les résultats de la recherche tous les documents où figurent tous les mots ou les phrases spécifiés.
- Exclut des résultats de la recherche, tous les documents où figurent le mot ou la phrase spécifié.

N'entrez pas d'espace entre les opérateurs et les mots suivants.

Exemples de recherche générale

Pour rechercher les documents qui répondent le plus à vos besoins, formulez votre requête le plus précisément possible.

Classement des résultats

AltaVista classe les résultats d'une recherche en fonction d'un score comprenant les critères suivants : Si vous n'êtes pas satisfait du premier classement de documents issu de la recherche effectuée par AltaVista, vous devez approfondir votre recherche. 

Recherche élaborée

Les requêtes de recherche élaborée utilisent les mêmes règles de syntaxe générales que les requêtes de recherche générale. Elles proposent cependant plus d'options pour affiner les recherches en utilisant des opérateurs et des expressions. Ce type de recherche vous permet également de contrôler davantage les résultats de votre recherche. Il vous faut cependant être plus précis afin d'obtenir les résultats escomptés.

Syntaxe de la recherche élaborée

Comme pour la recherche générale, vous pouvez grouper des mots pour former une phrase. Vous devez cependant utiliser un opérateur pour associer plusieurs mots ou phrases dans la même recherche. Les opérateurs de la recherche élaborée sont les suivants :
Mot-clé Symbole Action
AND & Recherche uniquement les documents où figurent tous les mots ou phrases spécifiés.
OR | Recherche les documents contenant au moins l'un des mots ou phrases spécifiés.
NOT ! Exclut les documents contenant le mot ou la phrase spécifié.
NEAR ~ Recherche les documents contenant à la fois les mots ou les phrases spécifiés, ceux-ci étant séparés par 10 mots.

Vous pouvez entrer les mots-clés soit en majuscules soit en minuscules. Si vous les écrivez en majuscules, vous pouvez ainsi les distinguer des autres mots faisant partie de votre recherche. Vous pouvez également entrer des symboles à la place des mots-clés, bien que la requête semble ainsi plus énigmatique et moins interactive.

Remarques

Exemples de recherche élaborée

Les exemples suivants vous expliquent comment utiliser les opérateurs et les parenthèses pour écrire une requête de recherche élaborée.
(pomme OR poire) AND (tarte OR tourte)
Cette requête exige que figurent dans le même document les mots pomme ou poire avec les mots tarte ou tourte. La recherche est entièrement réussie si le résultat comporte ces quatre mots ; cependant, tout document doit contenir l'un des mots se rapportant aux fruits et l'un des mots se rapportant aux aliments cuits.
John NEAR Kennedy
L'opérateur NEAR permet de s'assurer que, dans tout document issu de la recherche, les mots John et Kennedy sont séparés l'un de l'autre par 10 mots. Les noms pouvant apparaître sous différentes formes, cet opérateur s'avère donc très utile. Dans cet exemple de requête, vous obtenez les possibilités suivantes : John Kennedy; Kennedy, John; John Fitzgerald Kennedy; et John F. Kennedy.
légume AND (NOT brocoli)
En précisant les opérateurs AND NOT, les documents trouvés contiendront le mot légume et non le mot brocoli.


 La syntaxe légume NOT brocoli (sans l'opérateur AND) entraîne une erreur de syntaxe. Lorsque l'opérateur NOT n'est pas placé en début de requête, utilisez l'opérateur AND pour relier la partie NOT au reste de la requête. (La syntaxe OR NOT est également correcte. Cependant, vous risquez d'obtenir des résultats plus nombreux mais moins pertinents, dans la plupart des cas).
 
 

Classement des résultats de la recherche élaborée

Contrairement aux recherches générales, AltaVista affiche les résultats d'une recherche élaborée dans un ordre quelconque, à moins que vous ne spécifiez des règles de classement. Dans certains cas, il est préférable de ne pas définir de règles de classement comme lorsque vous souhaitez rechercher toutes les pages Web contenant des liens vers votre page d'accueil et afficher uniquement le nombre de page. Dans une opération de comptage, seul le nombre, et non l'ordre des résultats, est significatif.

Dans la plupart des cas, cependant, vous souhaiterez filtrer les résultats de votre recherche afin d'afficher au début de la liste les documents les plus pertinents. Pour classer les résultats, entrez des mots ou des phrases dans le champ Classement. Séparez ces mots ou ces phrases multiples par des espaces. Vous pouvez utiliser les mots faisant partie de votre requête ou entrer de nouveaux mots afin d'affiner davantage votre recherche. Par exemple, vous pouvez encore affiner la recherche sur yoga AND hatha en entrant débutant et confirmé dans le champ Classement.

Dans un classement, vous pouvez uniquement visualiser les 200 premiers documents. Le classement accordant la priorité aux documents qui répondent le mieux aux critères de recherche définis, vous devriez trouver les informations les plus pertinentes dans ces 200 documents. Pour de plus amples informations sur les facteurs modifiant le classement, reportez-vous à la section Classement des résultats.

Recherche dans une période définie

Vous pouvez limiter votre recherche sur une période définie en entrant des dates dans les champs Date de début : et Date de fin : au bas de l'écran de la recherche élaborée. AltaVista Search recherche alors des correspondances pour le délai spécifié en prenant comme référence la dernière heure de modification de la page Web. Cette information n'est pas toujours précise car le logiciel l'obtient du serveur Web où figurent les pages.

Entrez la date sous le format suivant : jj/mmm/aajj est le jour du mois, mmm est l'abréviation du mois, et aa sont les deux derniers chiffres de l'année. Vous devez utiliser le nom du mois et non le nombre correspondant. Ainsi, il n'y a pas d'ambiguïté sur le format des dates entre les différents pays. Par exemple :

09/jan/96
Si vous oubliez d'indiquer l'année, l'outil de recherche considère qu'il s'agit de l'année en cours.


Formatage des résultats de la recherche

Dans les écrans de recherche générale et de recherche élaborée, pour formater l'affichage des résultats d'une recherche, vous pouvez choisir les options suivantes :
Format Fonction
Format standard Affiche un lien d'accès vers le titre et l'URL de chaque document, les premières lignes de ce document, la taille et la date d'enregistrement de ce document sur le Web.
Format condensé Affiche un lien d'accès vers le titre de chaque document, la date d'enregistrement et les premiers mots. Ces informations tiennent sur une ligne.
Comptage uniquement Affiche le nombre total de documents trouvé pour le critère de recherche défini, sans aucune autre information supplémentaire. Cette option est uniquement disponible à partir de l'écran de la recherche élaborée.

Remarques


Utilisation de mots-clés pour affiner les recherches

Dans les interfaces de recherche générale et élaborée, vous pouvez utiliser des mots-clés pour restreindre vos recherches aux pages répondant à des critères spécifiques pour ce qui concerne la structure et le contenu d'une page Web. A l'aide des mots-clés, vous pouvez fonder votre recherche sur un URL ou une partie d'un URL ou bien sur les liens, les illustrations, les texte et le codage contenus dans une page Web. Vous pouvez ainsi exécuter les opérations suivantes : Pour les recherches basées sur les mots-clés, votre requête doit avoir le format suivant : mot-clé:critère-recherchemot-clé correspond à une liste d'éléments spéciaux qu'AltaVista peut rechercher, et critère-recherche est la chaîne ou la condition que vous souhaitez trouver.

Vous devez entrer le mot-clé en minuscules suivi immédiatement de deux-points. Pour spécifier une phrase dans les critères de recherche, utilisez les mêmes conventions que celles utilisées pour spécifier une phrase dans une requête classique. La méthode la plus pratique consiste à entrer la phrase entre guillemets.

Le tableau suivant décrit les mots-clés acceptés par AltaVista Search :
Mot-clé Fonction
anchor:texte Recherche les pages contenant le mot ou la phrase spécifié dans le texte d'un hyperlien.
applet:catégorie Recherche les pages contenant une applet Java de la catégorie spécifiée.
domain:nom du domaine Recherche les pages contenant le mot ou la phrase spécifié dans le nom de domaine du serveur Web où figure la page (la partie la plus à droite d'un nom d'hôte Internet est le nom du domaine).
host:nom Recherche les pages contenant le mot ou la phrase spécifié dans le nom d'hôte du serveur Web où figure la page.
image:nom du fichier Recherche les pages contenant un marqueur d'image avec le nom de fichier spécifié.
link:texteURL Recherche les pages contenant au moins un lien vers une page avec le texte spécifié figurant dans son URL.
text:texte Recherche les pages contenant le texte spécifié dans une partie de la page qui n'est pas un marqueur d'image, un lien ou un URL.
title:texte Recherche les pages contenant le mot ou la phrase spécifié dans le titre.
url:texte Recherche les pages contenant le mot ou la phrase spécifié dans l'URL.

La recherche d'URL à l'aide des mots-clés url, host, et domain porte sur une partie spécifique de l'URL lui-même ou sur le nom d'hôte ou de domaine où figure la page Web.

Les mots-clés link et anchor recherche tous les deux des informations sur les renvois. Le mot-clé link recherche un texte dans un URL qui est la cible d'un renvoi (par exemple, http://www.abc.org/help.html), alors que le fixateur recherche le véritable texte d'un hyperlien tel qu'il s'affiche sur une page Web pour les utilisateurs (par exemple, cliquez ici).

Les marqueurs text et title recherchent tous les deux le contenu d'un document. Le mot-clé text recherche tout texte visible (autre que les marqueurs, liens et URL) dans un document, alors que le mot-clé title restreint la recherche au texte codé par l'auteur du document dans le marqueur <title>. Le titre correspond au texte qui s'affiche dans le bandeau de la fenêtre de votre navigateur Web. Le mot-clé title est un excellent moyen de limiter votre recherche aux pages les plus significatives se rapportant à une rubrique.

Exemples

url:http://www.kiwihome.co.nz/séjour
Recherche toutes les pages où les mots http://www.kiwihome.co.nz/séjour figurent dans l'URL (vous obtenez une liste des pages publicitaires des auberges « bed and breakfast » classées par région en Nouvelle-Zélande).
 

 

host:www.kiwihome
Recherche les pages où www.kiwihome figure dans le nom d'hôte du serveur Web.
 

 

domain:nz
Recherche les pages où le nom de domaine nz figure dans le nom d'hôte du serveur Web.
 

 

image:comète.jpg
Recherche les pages contenant un marqueur d'image qui fait référence à comète.jpg.
 

 

anchor:"cliquez ici"
Recherche les pages où figure la phrase cliquez ici dans le texte d'un hyperlien.
 

 

link:http://www.abc.org/mapage.html
Recherche les pages où figure au moins un lien vers une page à l'adresse URL suivante http://www.abc.org/mapage.html.
 

 

link:http://www.abc.org/mapage.html -host:www.abc.org
Recherche uniquement les pages externes où figurent les liens vers l'URL spécifié (l'opérateur - exclut de la recherche, sur le même serveur, les pages spécifiées après ce signe).
 

 

text:cithare
Recherche les pages où figure le mot cithare dans toute partie du texte visible d'une page et non dans un hyperlien ou un marqueur d'image.
 

 

title:"journal Le Figaro"
Recherche les pages où figure la phrase journal Le Figaro dans le titre.
 

 

applet:Liste ToDo
Recherche les pages où figure la catégorie d'applet Java Liste ToDo.
 

 


Comment influencer la façon dont AltaVista Search indexe votre page Web ?

En général, AltaVista Search indexe tous les mots sur une page Web et affiche les premiers mots, dans la page de résultats de la recherche, sous forme de résumé.

Dans votre page Web, les marqueurs META vous permettent de :

Prenons l'exemple suivant : votre page Web fait de la publicité pour un service de toilettage pour animaux familiers. AltaVista Search indexe automatiquement tous les mots sur la page. Cependant, vous souhaitez décrire votre service à l'aide d'autres mots ou phrases qui ne figurent pas sur cette page. Utilisez le marqueur META et entrez name="keywords" pour ajouter ces phrases à l'index. Il y a ainsi plus de chance que les utilisateurs trouvent votre page:
<META  name="keywords" content="toilettage pour animaux familiers,  
nettoyage du pelage, griffes">
Le marqueur META de description vous permet de spécifier ce que vous souhaitez afficher dans le résumé qui apparaît dans la page de résultats de la recherche. Ainsi, pour votre page sur le service de toilettage, vous pouvez entrer le slogan publicitaire suivant :
<META  name="description" 
content="Notre spécialité ! Le toilettage des caniches.">
AltaVista Search indexe tous les mots du marqueur de description en plus de ceux du marqueur de mots-clés. Ainsi, dans cet exemple, les utilisateurs trouveront votre page en recherchant aussi bien « caniches » que « service de toilettage pour animaux familiers », «nettoyage du pelage » ou « griffes ».

Au lieu d'afficher les premières lignes de la page Web, le résultat de la recherche affiche le texte du marqueur de description:

Au caniche bien tondu
Notre spécialité ! Le toilettage des caniches.
http://aucanichebientondu.org/ - taille 3k - 29 fév 96
Dans les marqueurs de mots-clés ou de description, vous pouvez entrer jusqu'à 1 024 caractères.


Comment supprimer l'indexation de votre page Web par AltaVista Search ?

Le logiciel AltaVista Search Intranet respecte la norme Standard for Robot Exclusion (SRE). Lorsque l'outil de regroupement de pages consulte un serveur Web, il examine le contenu du fichier robots.txt pour déterminer si cet outil de regroupement de pages est autorisé ou non à accéder aux pages Web du serveur. Si vous ne souhaitez pas qu'AltaVista Search Intranet regroupe votre page, l'administrateur du serveur Web ou vous-même peut spécifier AltaVista Intranet dans le champ Agent utilisateur d'une entrée dans robots.txt. Par exemple, le texte suivant, entré dans un fichier robots.txt, empêche le produit AltaVista Search Intranet de regrouper les pages contenant le mot /personnel aux URL correspondants :
   User-agent: AltaVista Intranet
   Disallow: /personnel/
Table des matières]