samedi 13 février 2010

Le Bus de Moteur de Recherche : le socle intelligent de l’entreprise 2.0

Le Bus de Moteur de Recherche (Enterprise Search Bus) devient un élément clé de l'infrastructure informationnelle et informatique des entreprises. Il annonce un déclin de l'importance stratégique de la base de données relationnelle, en en soulignant sa plus grande faiblesse : sa rigidité qui dans une perspective d'intelligence en fait un outil un peu bête. Voici pourquoi, et voici des conséquences pour l'écosystème du logiciel.

Contexte a deux axes : celui des contenus, et celui des contenants.

Axe 1 : on trouve trois grands types de données :

  1. Structurées (les chiffres, les états, …),
  2. Non structurées (les contrats, les catalogues, les documents…),
  3. Issues de l'échange et de la collaboration (messages, discussions, annuaires,...).

Axe 2 : les contenants tous types de données confondues, ont trois grandes missions :

  1. La première est historiquement leur raison d'être : garantir les transactions, car c'est finalement là que la donnée nait et/ou prend son sens en s'insérant dans la véritable activité économique de l'entreprise.
  2. La deuxième est un corollaire de la première mais a pris de plus en plus d'importance avec la croissance des volumes : être navigables et recherchables, car il faut pouvoir mettre la bonne donnée en face du bon opérateur ou de la bonne transaction.
  3. La troisième enfin nait de l'info-explosion et des enjeux de maitrise des couts énergétiques et économiques : gérer l'archivage, la conservation organisée des données.

Par un phénomène darwinien prévisible, chacune de ces grandes fonctions est devenue le champ d'acteurs spécialisés. Selon qu'on se trouve dans le structuré ou le non structuré, les acteurs peuvent être différents. Mais on assiste à un mouvement de fond intéressant : la base de données était le pivot de l'entreprise et c'est en train de changer. Le succès de la base de données a été fondé sur sa capacité à organiser et à garantir les transactions. Ce sont aujourd'hui, à l'heure de la redondance et du Cloud, des qualités assez basiques pour ne pas dire banales.

Pour faire une synthèse du paysage logiciel, le tableau ci-après explicite les logiciels ayant émergés comme clés sur les 9 intersections des deux axes évoqués plus haut.

Fontion / type de données

Structuré

Non-structuré

Personnes

Gestion des transactions et des process

ERP, CRM, applications métiers + Base de données.

BPM + CMS + Base de données

Outil de Mail, réseau social d'entreprise

Recherche et navigation, analyse

Business Intelligence + Data warehouse

Moteur de recherche integré

Moteur de recherche integré

Archivage, sauvegarde,…

Outils d'archivages dédiés

Outils d'archivages dédiés

Outils d'archivages dédiés


L'info-explosion relativise l'hégémonie de la base de données relationnelle

Jusqu'à l'info-explosion, on était en intégration verticale : Oracle en est un bon exemple qui est parti de la base de données relationnelle pour aller vers l'application de gestion de données structurées d'entreprise. On prospérait à l'intérieur d'un silo. Pour que cela fonctionne, les serveurs d'applications avec comme ambition de faire se parler entre elles les applications furent la suite logique dans ce paradigme. L'élément central sur lequel était construit le système d'information de l'entreprise 1.0, occupée à gérer correctement ses transactions, et à pouvoir compter et analyser ses données métier, était naturellement la base de données relationnelle. Tout en partait et tout y revenait. En dehors du File System et de la boite mail, longtemps considérés comme des outils mineurs réservés aux usages bureautiques, presque toute l'informatique d'entreprise s'est construite autour de la base de données relationnelle.

Mais la base de données relationnelle est un système lourd et couteux d'une part, quand en outre les outils de Business Intelligence manquent d'agilité. D'autre part, l'info-explosion des données non structurées (les mails et les fichiers des répertoires qui sont stockés « à plat », sans modèle relationnel) a fait progresser les technologies de recherche et de navigation. Comme les données non structurées sont devenues de plus en plus métiers et critiques, les outils d'accès à ces données sont devenus de plus en plus métier. Finalement si on peut dire, qui peut le plus peut le moins, et la base de données relationnelle devenant une source d'information comme les autres, elle est en train de passer du statut de référentiel du système d'information, à celui de simple contenant des données structurées. Elle se trouve à ce titre ni plus ni moins importante et stratégique que le CMS.

Deux conséquences d'importance sur l'apport du moteur de recherche au monde du structuré

  1. Les outils de Business Intelligence sont en train d'être marginalisés par les moteurs de recherche pour l'accès aux informations et à une vision 360. Dans 90% des besoins, le moteur de recherche fait plus souple et mieux que l'outil de BI. Cf. le témoignage récent du groupe Laser dans 01 Informatique (choix récent de Sinequa dans un bench de database offload face à un concurrent français bien connu. Un projet très intéressant qui vise à indexer l'intégralité des historiques de transactions des 22 millions de cartes de crédit Laser/Cofinoga)
  2. Avec la virtualisation des serveurs, sans parler de la migration progressive vers le Cloud, l'enjeu n'est plus de permettre aux applications de se parler, mais bien de disposer d'un référentiel cohérent de données. De ce point de vue, c'est la victoire annoncée de l'Enterprise Search Bus. Un Bus de moteur de recherche intelligent est capable de mettre en cohérence l'ensemble des données en les rendant cherchables et navigables par des axes métier, hérités des contenants ou générés à la volée. En la matière, on peut imaginer que la vision Search Bus s'appuiera sur ou absorbera les approches de type MDM (Master Data Management) qui sont en fait une réponse très aboutie, mais très spécialisée et assez lourde à la question.

L'Enterprise Search Bus devient stratégique pour l'entreprise

Ce qu'il faut retenir pour la construction ou l'évolution d'un système d'information est – mais on ne s'étonnera pas de me voir pousser cet argument - que le moteur de recherche est passé d'un gadget ludique (c'est vrai, qui a vraiment besoin d'un moteur de recherche au fond pour aller un peu plus vite sur les données de l'Intranet ou vers des documents perdus sur les répertoires partagés?) à un élément essentiel du système d'information de l'entreprise. L'Enterprise Search Bus est :

  • Clé pour unifier la donnée en la structurant par la composante métier,
  • Essentiel pour permettre non pas de chercher mais bien de réaliser la bonne opération, sur la bonne donnée, au bon endroit et dans la bonne application,
  • Majeur pour offrir une logique de travail simple. Simple parce qu'elle digère la complexité bien réelle de nos écosystèmes professionnels en la réduisant à une présentation logique, facile et intuitive. Parlez en aux consultants d'Atos Origin qui disposent depuis peu de Sinequa pour accéder à leurs données non structurées, ou aux consultants de Mercer ( cf Communiqué de Presse ci-joint).

Conséquences sur le marché du moteur de recherche d'entreprise

Quelques constats s'imposent. Pour être à la hauteur de l'enjeux, votre Enterprise Search Bus devra valider plusieurs critères essentiels :

  1. Intégrer une technologie intelligente de génération et de traitement des méta-données. Si la base de données relationnelle perd du terrain, le moteur a plus que jamais besoin de pouvoir fournir la structuration métier nécessaire. En la matière vous avez le choix entre le linguistique (Sinequa, FAST) ou le bayesien (Autonomy).
  2. Absorber toute la volumétrie et l'hétérogénéité de votre système d'information. Il vous faut de la scalabilité linéaire et des connecteurs sécurisés, déployable sans travail spécifique.
  3. S'intégrer dans une logique multiplateforme et portable. Vous êtes Java ou .Net, serveurs privés ou Cloud : votre Search Bus doit être agnostique en la matière.
  4. Et bien d'autres critères tels qu'une ergonomie simple comme l'iphone est simple, un produit 2.0 dans sa façon d'être utilisé (interactivité) et dans sa façon d'être déployé (pilotage web),…

Sinequa valide ces critères, mieux que quiconque je pense. Notre vision depuis de nombreuses années, le travail que nous menons avec nos clients en particulier depuis 2005, et notre adaptabilité nous permettent aujourd'hui d'avoir le bon produit au bon moment.

Je dois l'avouer : il y a 5 ans, nous pensions que le sujet était de transposer la proposition de valeur de Google dans l'entreprise. Notre département technique était obsédé par Google. Aujourd'hui, cela nous parait dérisoire, car notre mission est au cœur d'une entreprise de plus en plus virtualisée, au propre comme au figuré (informatique sur le Cloud, supply chain outsourcée, production délocalisée, marketing outsourcé, etc…). Le cœur de l'intelligence et de l'agilité de cette entreprise a besoin d'un search bus. Certains parlent de meaning based computing, j'oserais simplement parler d'une entreprise intelligente. La définition ci-après issue de Wikipedia me parait éloquente.

Intelligence vient du latin intellegentia (faculté de comprendre), dérivé du latin intellegere signifiant comprendre, et dont le préfixe inter (entre), et le radical legere (choisir, cueillir) ou ligare (lier) suggèrent essentiellement l'aptitude à relier des éléments qui sans elle resteraient séparés.

L'intelligence est l'ensemble des facultés mentales permettant de comprendre les choses et les faits, de découvrir les relations entre eux. L'intelligence est également admise comme étant ce qu'en fait elle permet : la faculté d'adaptation. Également l'intelligence pratique est la capacité d'agir de manière adaptée aux situations. Au niveau d'évolution de l'humain, la compréhension ne peut se concevoir sans un système de codification diversifié. On aboutit donc à l'intelligence conceptuelle, inséparable d'une maîtrise du langage (et donc des "mots") permettant le raisonnement complexe; le raisonnement étant l'opération mentale d'analyse permettant d'établir les relations entre les éléments. Enfin, et à ce même niveau, l'objet de l'intelligence est la connaissance conceptuelle et rationnelle

Le marché de l'Enterprise Search est passionnant. On s'est rendu compte que Google n'était qu'un suiveur médiatique et talentueux, peu présent sur les projets à valeur ajoutée. Aujourd'hui, tous les regards sont tournés vers FAST / Microsoft. Mais je pense que l'innovation et la valeur cette fois ci encore viendront d'autres acteurs. Je pense que les visions gagnantes ne pourront pas être fondées sur un bus de moteur de recherche étouffé par une chaine complète allant du système d'exploitation au browser en passant par le portail, le CMS et la base de données.

Je pense que la vision gagnante viendra d'un bus de moteur de recherche intelligent et souple, qui suivra l'évolution des différentes technologies et applications connexes, sachant faire le lien entre l'usager et la donnée. C'est un marché darwinien, il ne suffit pas d'avoir raison, il faut s'adapter en permanence. Alors rendez-vous dans 5 ans, quand le Cloud sera omniprésent.