Planète Web Sémantique

May 09, 2008

David Larlet

Séjour à Barcelone

Retours rapides après quelques jours :

  • Le catalan est plus proche du français que l'espagnol, pratique pour se faire comprendre après 10 ans sans avoir sorti un mot d'espagnol ;
  • 339 mails non lus (hors listes de diffusion) et 528 billets dans mon agrégateur... ;
  • Port Aventura >> Disneyland Paris : les attractions sont vraiment impressionnantes ;
  • O'Reilly France n'est plus. Préoccupant.
  • Ne cherchez pas les toilettes mais les lavabos en Espagne ;
  • Biologeek down pendant 12h, j'investigue ;
  • La boutique du Barça doit être plus grande que celles de l'OM, du PSG et de l'OL réunies.

by David Larlet at May 09, 2008 08:29 PM

Christian Fauré

Introduction à l’Entreprise 2.0

L’entreprise 2.0 est constitutive de deux tendances majeures :

  • La première tendance est celle du web 2.0 où il s’agit, comme on s’en doute, de mettre du web 2.0 dans le système d’information de l’entreprise.
  • La deuxième tendance est celle du “Software as a Service“, voire du “quelque chose as a Service” (XaaS), qui constitue une nouvelle façon de consommer les technologies de l’information, avec de nouvelles offres portées par de nouveaux acteurs dans le périmètre de l’entreprise.



Les deux tendances sont très intimement liées en ce sens que les solutions web 2.0 que le grand public connaît sont toutes, originairement, en mode Software as a Servce (SaaS). C’est à dire qu’aucune installation sur l’ordinateur individuel n’est requise : on accède directement à l’interface d’une application SaaS en utilisant un navigateur web, ce qui implique, comme on le verra, que les donnés soient stockées ailleurs que sur l’ordinateur, où dans le système d’information de l’entreprise. Elles sont souvent hébergées et gérées par l’acteur SaaS lui-même.


Commençons par le Web 2.0.

Premier constat, dès que l’on évoque le web 2.0 dans des réunions d’entreprise, les discussions partent dans tous les sens. C’est un sujet qui souvent passionne et où chacun a sa propre compréhension, mais cet enthousiasme et cette profusion fait souvent peur aux décideurs en entreprise. Ils n’y voient que confusion et manque de maturité.
D’où la nécessité de donner une vision structurante du Web 2.0 pour mettre l’entreprise dans de meilleures prédispositions aux opportunités offertes.

Je distingue trois composantes, que je nomme souvent “l’ADN du Web 2.0″, et qui sont : la participation, la simplicité, et enfin l’ouverture des données. Voyons ce qu’elles signifient.

1. La participation :
C’est l’axe business et organisationnel du Web 2.0.

Cet axe est très souvent mal compris ; aucune des entreprises avec lesquelles j’ai discuté ne le comprenait proprement. Souvent, on confond “participation” avec “volontariat” ou encore avec “personnalisation”, voire même avec des démarches de management des connaissances classiques.

Or, les mécanismes participatifs qui sont à l’oeuvre dans l’économie du Web 2.0 sont d’une puissance énorme : actuellement ils font, et défont, des empires. Toute entreprise qui est en contact direct avec le marché des consumers, du grand public, peut dévisser si un de ses concurrents, voire un nouvel acteur, met au point des mécanismes participatifs dans son coeur de métier.
Pour comprendre les enjeux de l’axe participatif du Web 2.0 il faut utiliser le concept de milieu associé que l’on emprunte à Gilbert Simondon.

La quasi totalité des entreprises travaillent en mode dissocié, c’est à dire que leur état d’esprit est le suivant :

“je produits et je vends, des services ou des produits, et vous les achetez”, dit autrement : “je produits, vous consommez, chacun à sa place”.

Il y a une dissociation entre le producteur et le consommateur, contrairement à ce que l’on constate sur le Web 2.0 où les producteurs peuvent être, en même temps, des consommateurs.
Accepter de mettre de la participation dans une entreprise c’est donc accepter de basculer dans un milieu associé, c’est à dire accepter que ses clients prennent part, en amont, au design et à la conception des services ou des produits de l’entreprise. C’est aussi accepter, en interne, de repenser les logiques d’organisation du travail afin de s’émanciper des pures logiques hiérarchique et administratives.
Autant dire que toutes les organisations n’ont pas le même degré de maturité face à cette bascule en mode participatif.

2. La simplicité :
C’est le volet design du Web 2.0.

Il s’agit de la simplicité des interfaces applicatives, qui relèvent bien souvent du cauchemar dès qu’on franchit les pares-feux des entreprises. Cela s’explique car les utilisateurs des applications sont rarement ceux qui décident ; dans le meilleur des cas on les consulte pour les fonctionnalités attendues, mais les interfaces de travail sont bien souvent la cinquième roue du carrosse.
Simplicité des interfaces renvoie donc à la convivialité des interfaces utilisateurs ainsi qu’à la réflexion autour du poste de travail en entreprise. Derrière cet aspect on retrouve également toutes les logiques de Rich Internet Application (RIA) ou Rich Desktop Application (RDA) dont Google, Microsoft et Adobe sont les principaux acteurs.
Mais l’axe simplicité du Web 2.0 renvoie aussi à la simplicité des services. Si les site web 2.0 qui ont du succès c’est toujours parce qu’ils proposent un service très simple, pas besoin d’une formation ou d’un mode d’emploi. Les solutions web 2.0 ne font qu’une chose et en général elle le font bien : Flickr pour partager des images, Youtube pour partager des video, Del.ico.us pour partager des bookmarks, etc. On est à l’opposé de la logique du “tout intégré” que portent généralement les systèmes d’informations des entreprises, induisant des lourdeurs dans la gestion et l’évolution de celui-ci. Par provocation on pourrait dire que la logique du web 2.0 c’est une logique du tout désintégré.

3. L’ouverture des données :
C’est le volet technique du Web 2.0.

Pour que les données et les services puissent collaborer et constituer un écosystème il faut que l’accès aux données soit non seulement possible mais aussi favorisé. Pour cela, l’ensemble des logiciels doivent proposer des APIs (Application Programming Interface). Ces APIs décrivent comment accéder aux données et aux services de l’application, c’est grâce à elles que les programmeurs peuvent créer de nouveaux services très simplement à partir d’autres services et réutiliser des données existantes.

C’est cette possibilité qui permet de faire des Mashups, c’est à dire des mélanges de données provenant de différents services applicatifs (ce que fit Google en proposant des APIs pour Google Maps permettant d’exposer des données pour géolocaliser un lieu sur une carte).

Dans le périmètre de l’entreprise, les applications doivent proposer des APIs pour pouvoir exposer des données qui seront utilisées ailleurs, et pourquoi pas à l’extérieur de l’entreprise. Pour une banque de détail par exemple, il s’agira d’exposer les données financières des clients pour leur permettre de consulter leur état de compte dans un portail personnalisé grand public comme Netvibes ou iGoogle. C’est à dire que les données de l’entreprise peuvent être consultées indépendamment de l’interface que propose la banque sur son propre site web.

Bien sûr, les application natives du web 2.0 (Blogs, wiki) ont cet  “ADN du Web 2.0″, et donc cette ouverture des données en standard en proposant des APIs et en générant des flux Atom/RSS.

Voyons à présent les logiques industrielles et économiques dernières le web 2.0.
Le Web 2.0 a changé la figure du web en ce sens que le web a commencé à devenir non plus un web de pages mais un web de données.

Dans le web de pages, les informations sont stockées puis projetées sur la toile, c’est un procédé essentiellement cinématographique qui est à l’oeuvre, avec le public des internautes qui regarde et consulte les pages sur la toile.

Avec le web 2.0, les sites web proposent de stocker les données des internautes (le fameux User Generated Content), le sites web deviennent dès lors de moins en moins des vitrines de documents commerciaux mais de véritables applications qui se nourrissent du contenu envoyé par les utilisateurs.
Avec les données des utilisateurs (documents, photos, video, audio) sur le web, on peut dire que le Web devient la plate forme de données pour le grand public. Mais cela va beaucoup plus loin car le web devient également la plate-forme de toute l’industrie des technologies de l’information.

Mais si le web est la plate-forme, qu’est ce que le Web aujourd’hui ?
Comme on l’a vu, c’est le web 2.0, mais peut-importe son nom, c’est juste le web d’aujourd’hui. En revanche, ce que l’on voit moins, c’est que le web 2.0 n’est que la partie visible de l’iceberg, la partie immergée étant le Software as a service. Et ce pour une raison bien simple : tout les services web 2.0 reposent sur des logiciels qui ne sont pas installés sur l’ordinateur, ou dans le système d’information (je mets de côté les logiques hybrides de type RIA, RDA, voire même les plugins Firefox).
Je rappelle ici après les bases de définition de ce qu’est le Software as a Service.

Full Web :


Le SaaS est totalement intégré dans l’environnement du web, dans son architecture et dans le respect des standards. En conséquence on accède aux services en mode SaaS par HTTP et via une URL, et bien sûr on offre toutes les APIs qui vont bien.

Économies d’échelle et outil de production :


Un acteur SaaS est de facto dans une logique industrielle d’économie d’échelle. Il doit bénéficier d’infrastructures importantes pour la production de ses services, soit les siennes s’il veut être un acteur de rang 1, soit celles d’un partenaire (par exemple Amazon) s’il est un acteur de rang 2.

Sans installation :


Aucune installation dans le système d’information et aucun accès à l’environnement desktop sur le poste de travail n’est nécessaire. Tout passe par le navigateur.

Multi-tenants :


Une seule instance du logiciel pour x clients. Ce qui signifie que l’environnement de production est mutualisé et virtualisé. Aucun hébergement dédié pour un client n’est possible. Et ce, contrairement aux solutions ASP qui disposent d’un environnement dédié pour chaque client et qui donc ne peuvent bénéficier des vertus de la mutualisation (nouveaux clients = nouvelles bases de données).

Web Analytics :


Une solution SaaS n’est viable que si elle dispose de puissants outils d’analyse et de reporting pour détecter les tendances d’utilisation et de comportement des clients. Grâce à çà, les évolutions seront plus en phase avec les pratiques des utilisateurs. Le vrai métier d’un acteur SaaS c’est de “tâter le pouls” de ses utilisateurs en quasi temps réel.

Agilité :

La conséquence de plusieurs des points précédents est qu’une solution SaaS doit faire preuve d’agilité dans l’évolution de la solution. Les développements sont incrémentaux, c’est le règne du Beta, de l’essai et de l’expérimentation permanents pour coller au plus prêts du marché et générer le plus d’innovation possible.Mais pourquoi la démarche de fond qu’est le Software as a Service va-t-elle avoir le même impact sur le monde de l’entreprise que celui quel a dans le domaine du grand public ?
Pour le comprendre on s’aidera du paradigme de la long tail dans le schéma ci-dessous :

On voit bien que les acteurs proposant des solutions en mode SaaS viennent soit du marché grand public, soit du marché des PME. Or, les technologies de l’information restent une industrie et à ce titre sont soumise à certaines logiques industrielles dont l’une des toutes premières est la nécessité de faire des économies d’échelle pour abaisser les coûts.

Oeuvrant sur le marché grand public, les acteurs SaaS ont de facto conçu des solutions utilisées par des millions d’utilisateurs, constituant ainsi une des condition de base pour faire des économies d’échelles, à savoir un marché de masse.
Ce marché de masse étant constitué par l’agrégation de millions d’utilisateurs :
Enfin, pour répondre à ce marché de masse, il a fallu constituer un véritable outil de production industriel de masse, renvoyant tous les acteurs dit “professionnels” au rang d’artisans. Aujourd’hui prêt de 2% de la production électrique totale des USA est consommée par les data centers, fini de rigoler donc.
La conséquence de cette mutation industrielle est que le système d’information d’une entreprise va être de plus en plus déporté de ses locaux vers les plates-formes web en mode SaaS (voir le parallèle fait par Nicholas Carr dans son dernière livre “The big Switch”, même si le livre est très médiocre). Autre conséquence bien sûr : les données ne vont plus être dans le giron technologique de l’entreprise.Les données du système d’information de l’entreprise vont être réparties sur ce que l’on commence à appeler des super-plateformes :


Attention, tout n’est pas magique, il y a des points de vigilance que chaque entreprise doit évaluer.

La qualité réseau : dans l’optique d’une bascule de plusieurs milliers d’utilisateurs vers des solutions en mode SaaS il vaut mieux muscler la qualité réseau de la connexion internet (qui est généralement médiocre dans les entreprises). La bonne nouvelle est que le coût de la bande passante internet est moins chère que celui des réseaux internes (LAN ou WAN), mais il faudra quand même revoir la politique réseau de l’entreprise.

La Road Map (modifications et ajout de nouvelles fonctionnalités) d’une solution SaaS est quelque chose que l’entreprise ne va plus maîtriser. On le voit au quotidien avec les modification que fait Google sur Google Doc : un coup l’interface change, de nouvelles fonctions sont ajoutées, et tout cela bien sûr sans demander l’avis des clients ou des utilisateurs. Il faudra notamment mettre en place un support/help desk musclé car le moindre changement et c’est des milliers d’appels assurés (je ne trouve plus le bouton “Enregistrer”!)

La confidentialité des données est bien sûr un sujet de discussion majeur. Mais il est en grande partie psychologique de mon point de vue.

Autre point à aborder avant de passer au SaaS : le Off Line. Que vont faire tous vos employés s’ils ne se sont plus connectés ? Il faudra identifier les situations de mobilité et d’absence de connexion afin de mesurer objectivement l’impact que peut avoir le mode déconnecté sur certaines populations. Jetez également un oeil aux modes déconnectés qui existent (en natif chez Microsoft pour cause de client lourd, intégré ou à venir chez Salesforce et Google).

Le statut juridique des acteurs en mode SaaS reste encore flou : souvent ils ont le statut de “fournisseurs de contenu”, étrange quand on sait que c’est vous qui fournissez vos données! Sachez également que la législation Américaine et Européenne n’est pas la même. Il existe des solutions sectorielles en mode SaaS incompatibles avec la législation européenne qui interdit à certaines entreprises de déléguer la gestion et le stockage des données à des tiers.

Bien sûr il faudra évaluer les modalités de sortie de la solution SaaS, ce n’est pas après une migration massive des données qu’il faudra réaliser qu’il n’y a rien de prévu pour automatiser l’export des données (on parle de Rollback).

Dernier point, il ne faudrait pas passer d’une logique de silos applicatifs dans le système d’information tant décriée, à une logique de silos sur le Web. Les solutions SaaS choisies devront être interopérables avec d’autres offres SaaS et bien évidemment continuer à être articulées avec les application patrimoniales (Legacy qui restent dans le systèmes d’information. La richesse des APIs sera ici déterminante.

Nous voilà arrivés au terme de cette introduction à l’Entreprise 2.0 avec, pour terminer, un petit schéma qui résume la définition suivante :

Une entreprise 2.0 est une entreprise qui est soumise à un double mouvement de balancier : d’un côté elle met du Web 2.0 dans son système d’information, et de l’autre elle commence à basculer une partie de son portefeuille applicatif en mode SaaS.

by Christian at May 09, 2008 05:05 PM under Internet

Alexandre Passant

First workshop on Social Data on the Web at ISWC2008

As you may have already read, the 1st workshop on Social Data on the Web (SDoW2008) will be held at next ISWC, at the end of October in Karlshrue and I’m really glad to co-chair it with Uldis, John and Sergio.

If you work on a related field, either as a researcher, industrial or developer, you’re more than welcome to submit a paper, a poster or a demo until the 25th of July via easychair. More information about the topics and organization of the workshop it can be found on the SDoW2008 website.

While talking about the Social Web, the proceedings of the SAW2008 workshop that was held tuesday in Innsbruck will be online soon on CEUR-WS website (Vol. 333). Here are also the slides of our talk I gave here, and the one I gave in the main conference about another paper (that should be soon uploaded here).

by Alex at May 09, 2008 11:00 AM under WebSemantique

Xavier Lacot

Le début de la gloire

One night on the Earth

On Strange days, facing yourself is worth stopping the time... One night on the Earth, Flickr

Vous pouvez me voir en vidéo, pour de vrai comme à Hollywood, sur tv4it.net, une chaîne de télévision Web sur laquelle je suis intervenu il y a deux semaines au sujet des RIA et autres RDA :

by Xavier Lacot (xavier@lacot.org) at May 09, 2008 01:25 AM

May 08, 2008

del.icio.us

Go3R

Moteur de recherche scientifique basé sur la sémantique. Woaw! Contre les expérimentations animales.

by of at May 08, 2008 09:23 PM under WebSemantique

Karl Dubost

May 07, 2008

Nicolas Cynober

Israël #1: Pas de violence, c’est les vacances


Au programme (à part la plage)

  • Jeudi 8: Arrivée (5 heures de vol quand même)
  • Vendredi 9: Journée à Jérusalem
  • Samedi 10: Visite du Sud d’Israël – Beer Sheva / Massada et Mer Morte
  • Dimanche 11 : Visite de l’incubateur NGT de Nazareth, visite du Technion de Haïfa
  • Lundi 12: Rencontre avec Olivier Rafowicz et Dan Catarivas à l’Université de Tel-Aviv
  • Mardi 13: Visite de l’Institut Weizmann, de la plage de Palmahim et de la base militaire
  • Mercredi 14: Visite de Israël Aircraft Industry (sous réserve d’autorisations)

Si vous connaissez la région. Laissez moi vos bonnes adresses !

Comme vous l’avez deviné le blog ne sera pas très actif cette semaine. Le sable et l’eau de mer ça bousille les ordis ;)

by Nicolas at May 07, 2008 07:53 PM under Israel

Nicolas Cynober

Soirée TV sur dailymotion

Hier soir, une de ces soirées ou vous n’avez rien envi de faire, vous avez jeté un coup d’oeil désespéré au programme TV, rien. Et bien allez donc faire un tour sur les chaines dailymotion, ces temps ci la créativité y est débordante, je me suis régalé en découvertes, sautant de morceaux de musiques, en sketchs, en passant par une vidéo de futsal, je voulais justement m’y mettre ;)

Si l’UGC montrait depuis 2005 des lacunes au niveau de sa qualité, on voit clairement que la longue traine des contenus commence à s’épaissir. Actuellement les auteurs sont encore dépendent des revenus des anciens médias, je découvre que la p’tite couronne passe maintenant sur MCM. Mais ce n’est qu’une question de temps, la monétisation de l’UGC est en cours et les plateformes de contenu n’oublieront pas ses créateurs.

Certains artistes se permettent même de snober les anciens médias. La fameuse chanson du dimanche cartonne en concert, adulés par leurs fans (8 chansons vues plus de 100.000 fois). C’est Rémi du show ‘n’importe qui‘ qui aura eu les plus mauvaises relations avec la TV. Ses idées étant volées par Michael Young (13ème minute de l’interview). Et du coup cela reste pour moi le plus bel exemple de monétisation, il a crée des vidéos pour Nike (vu + de 1.700.000 fois !) et Orangina. A mourir de rire :) Et le prochain DVD est en cours …

Il reste encore des problèmes d’éditions. Car si tout est disponible, faut-il encore protéger les mineurs. Comme le dernier clip de Justice, déjà vu 300.000 fois, qui a été interdit des chaines de TV pour cause d’incitation à la violence.

Bref une heure de découverte, de contenu de qualités, de rire, de nouveautés musicales, que demander de plus…

Et vous quels sont vos émissions favorites sur le web ?

by Nicolas at May 07, 2008 10:33 AM under Média

May 06, 2008

Christian Fauré

Le numérique dans l’économie et la cognition de l’attention

C’est le titre du prochain débat d’Ars Industrialis qui aura lieu au Théâtre National de La Colline, 14 rue Malte Brun, Paris 20°, le 17 mai 2008 à 14 heures (Entrée Libre).
Le titre de l’intervention d’Alain Giffard sera : Lecture numérique, lectures industrielles : contrôle de l’attention et catastrophe cognitive, et celui de mon intervention : La gigantomachie autour des data centers.
Ci-après la présentation des interventions.

Christian Fauré : La gigantomachie autour des data centers

Ce qui nous motive, à Ars Industrialis, c’est la constitution d’une politique industrielle des technologies de l’esprit. Or cette question ne peut s’instruire sans connaître l’évolution toute récente de l’industrie des technologies de l’information.
En quelques années, nous avons ainsi assisté à des investissements colossaux dans la construction de centres de données et de calculs, les fameux data centers. Cette concentration d’outils de production industriels de masse (puissance de calcul et de stockage) rappelle à certains égards l’évolution qu’à connu le secteur de l’énergie électrique à un siècle d’intervalle. C’est d’ailleurs sur ce parallèle que se fonde l’argumentation du journaliste américain Nicholas Carr dans son dernier ouvrage : “The Big Switch : rewiring the world, from Edison to Google”.

Confirmant les diagnostics qui ont déjà été fait par l’association, personne ne sera surpris de constater que les plus grands acteurs industriels de cette concentration (Google, Amazon) sont des acteurs financés par la vente de produits culturels ainsi que par la publicité.

C’est donc une forme de géopolitique de la situation qui sera ainsi présentée afin de nous donner les moyens d’analyser le sens et les enjeux de cette concentration des data centers. Il faudra également relativiser les propos de Nicholas Carr dans le parallèle qu’il fait entre l’industrie des technologies de l’information et l’industrie électrique, car la métaphore empêche de penser cette nouvelle politique industrielle des technologies de l’esprit à laquelle nous appelons.

C’est par la compréhension des enjeux de cette véritable gigantomachie, à laquelle nous assistons en ce début de XXI siècle, que nous pourrons faire des premières propositions concrètes qui seront soumises à la discussion avec le public lors de cette séance…

Alain Giffard : Lecture numérique, lectures industrielles : contrôle de l’attention et catastrophe cognitive

L’interrogation initiale est une partagée par le public le plus large : quel est le devenir de la lecture dans le temps où se développe sa forme numérique ?
Et, pour commencer : la lecture numérique existe-t-elle ? peut-elle « prendre la place » de la lecture classique ?Cette question est abordée à travers les notions communes à Ars Industrialis, et reprise aussi en fonction des thématiques travaillées en ce moment par l’association: la relation inter-générationnelle, l’éducation, le soin des enfants ; la réflexion sur l’économie politique et l’hypothèse d’une « économie de la contribution ». La lecture numérique est donc envisagée du double point de vue d’une nouvelle et nécessaire instrumentation des savoirs, et d’une réflexion sur l’économie de l’attention, point crucial pour les enfants.En m’appuyant sur une étude remise au ministère de la Culture et de la Communication, je soulignerai plusieurs traits de la lecture numérique : son caractère de « technique par défaut » et la surcharge opératoire du lecteur qui en découle ; le risque d’une concordance entre le type d’attention mobilisée (« hyper attention » plutôt qu’attention soutenue), le type de lecture (de scrutation ou d’information plutôt qu’approfondie), et le degré d’exécution de l’acte de lecture; la place de la simulation.Comme pratique, la lecture numérique se développe dans un cadre général que caractérisent deux nouveautés inouïes : le retrait des puissance publiques, et l’essor des industries de la lecture. L’abstention ou l’incurie des puissances publiques suscite un face à face du public des lecteurs numériques et des industries de lecture. La tension de ce face-à-face n’est rien d’autre que ce qui structure aujourd’hui « l’espace des lectures industrielles ».

J’essaierai d’examiner comment les pratiques de lecture des enfants et des jeunes s’inscrivent dans cet espace des lectures industrielles. Comme technologie, la lecture numérique est à la fois poison et contre poison. Elle peut assister le développement du sens critique, notamment en permettant une autre grammatisation de l’audiovisuel. Mais elle peut aussi, comme les autres technologies de l’information, devenir un instrument dans la concurrence de plus en plus déclarée que les médias générationnels livrent à l’école et aux parents. C’est au point précis où se croisent le marketing des médias générationnels et le groupe dit des « natifs du numérique », c’est à dire là où le conflit pour le contrôle de l’attention des enfants et la définition de la lecture de référence est le plus ouvert que se situent, selon moi, les risques véritables d’une catastrophe cognitive et culturelle.

by Christian at May 06, 2008 11:17 PM under Divers

Karl Dubost

Livre sous couverture

Je suis allé à la terrasse de mon café favori à shimokita. Je ferme mon gilet noir, serre l'écharpe rouge florale, me blottis dans la chaleur de mon corps. Sur la table, en plus de mon carnet, il y a Itinéraire d'enfance de Duong Thu Huong, un beau livre tant par son enveloppe que son contenu.

May 06, 2008 04:54 AM under lecture, livre, carnet

May 05, 2008

Nicolas Cynober

Qui qui twitte ?

Ceux qui me connaissent personnellement seront étonné par ce billet. Je passe officiellement dans la catégorie des blogueurs “fashion” puisque je viens de réactiver mon compte Twitter. Cela signifie que je vais m’y mettre, en tout cas m’y essayer. Pourquoi utiliser Twitter ? Dans mon cas c’est très clairement dans une optique professionnelle. Je n’ai pas besoin de ce genres d’outils pour rester en contact avec mes proches. Par contre c’est très intéressant d’envoyer et de recevoir des alertes “pro” sur des sujets précis. A peine inscrit je viens de m’apercevoir que j’ai raté Henri Kaufman aujourd’hui à l’ESCP pour la conférence Marketing 2.0. J’aurais eu plaisir à bavarder avec lui, nous nous étions croisé sur une mission de conseil. Un bénéfice immédiat dès la première utilisation, cela donne envie d’aller plus loin.

Alors que pourrez-vous trouver sur mon Twitter ?

  • Mes interrogations et mes recherches sur le web d’aujourd’hui et de demain.
  • Mes travaux actuels. Très techniques ces temps ci. Aujourd’hui j’aurais pu diffuser des commentaires sur Zend, la scalability de LAMP ou encore l’intégration continue avec CruiseControl.
  • Mes déplacements et événements “pros”. Ex: mon voyage à venir dans la silicon valley israélienne.
  • Des news sur le projet que je lance (à venir dans ce blog…)

Mais ne vous inquiétez pas, je n’utilise pas le dernier client twitter à la mode, je n’ai pas de graph social twitter et je ne consulte pas le trafic RATP sur twitter… Pas encore :)
Alors qui qui twitte ?

by Nicolas at May 05, 2008 07:36 PM under Uncategorized

May 04, 2008

del.icio.us

del.icio.us

del.icio.us

May 03, 2008

Gautier Poupeau

A la découverte du Web sémantique et de ses technologies

Pour vous faire patienter avant que ce blog ne reprenne un rythme normal de publication (d'ici un mois ou deux...), je vous propose une présentation du Web sémantique et de ses technologies sous la forme d'un diaporama. Il a été mis au point pour présenter le sujet à mes nouveaux collègues. J'espère qu'il pourra vous aider à mieux comprendre les buts poursuivis par le Web sémantique et ses technologies.

Bonne lecture et à bientôt !

by got at May 03, 2008 03:22 PM under WebSemantique

del.icio.us

del.icio.us

SemanticCamp Paris, 02/2008

serie de 5 videos : "L'objectif du SemanticCamp Paris est de creer les conditions pour que les developpeurs, les etudiants, les managers et les chercheurs se rencontrent sur le theme du Web Semantique."

by electropublication at May 03, 2008 10:37 AM under WebSemantique

May 02, 2008

Alexandre Passant

Semantic Web talks in Innsbruck

I’ll present a paper co-written with Uldis Bojars, John Breslin and Stefan Decker - and with Dan Brickely’s valuable feedback - titled “Social Networks and Data Portability using Semantic Web technologies” on the 2nd Social Aspects on the Web workshop (SAW2008) next tuesday in Innsbruck. As you can guess, the talk will show how FOAF and SIOC can provide efficient and normalized ways to model social networks and user contributions on the Web and thus achieve (some of) the data portability goals. Uldis will also give a related talk on Friday at XTech in Dublin.

Some Semantic-Web related talks also occur in the main BIS conference, with some keynotes on this topic and various talks related to ontologies on monday afternoon, some of them also linking to Web 2.0 aspects as tagging and wikis. It should be interesting to see how the social semantic web (call it web n.0) is spread in organizations. I’ll also present here the use of a form-based Semantic Wiki in corporate environment. Think of it as “hidden semantics” or how to let people manage ontology instances and re-use it without any knowledge of RDF. BTW, the great talk by Denny Vrandečić about Semantic MediaWiki in the WWW2008 Dev-Track also showed how SMW could be used that way, with a nice example :-). Once again, I really enjoyed the experience of being there, meeting some of the people I knew only on the Web, listening to great talks (I especially liked Google’s keynote about cloud computing, querying and fuzzy-logic, Web 2.0 and learning , W3C SW track, Dev-track and SW panel, and of course the LDOW workshop) and presenting some of my works in front of such an audience.

Next steps, ESWC2008 and related workshops, IC, and of course, finish writing my PhD thesis… you were right Tom, it really takes a long time!

by Alex at May 02, 2008 10:51 AM under WebSemantique

April 30, 2008

David Larlet

Le web sémantique en vidéos

Un SemanticWebCamp comme si vous étiez. Au passage, IDSelector est une initiative intéressante pour faciliter l'implémentation d'OpenID au niveau front.

by David Larlet at April 30, 2008 10:08 PM under WebSemantique

April 29, 2008

David Larlet

Des formations Django

Proposées par Toonux, voila une excellente preuve (s'il en fallait) de l'explosion d'un framework. Très encourageant.

by David Larlet at April 29, 2008 05:58 PM

April 28, 2008

Christian Fauré

Shots that changed my life (19)

Planète interdite (Forbidden Planet) : Film de science fiction de Fred McLeod Wilcox, 1956, USA.

Le héros de ce film est le “data center”, un data center aux proportions titanesques. Mais toute cette machinerie pour quoi ? Pour matérialiser nos pensées et notre subconscient.
Mais que ce passe-t-il quand nos démons prennent “forme” ?


Puisqu’on est dans la série “shots”, je choisirai donc la scène de la visite du data center (que l’on aperçoit dans le trailer)

Sans contexte un des meilleurs film de science fiction car ayant su marier des thèmes psychanalytiques et technologiques.

Et cette musique électronique de Bebe et Louis Barron …

by Christian at April 28, 2008 04:58 PM under Art

Nicolas Cynober

Libérons les données !

Il me parait tous les jours plus clair que nos amis les données veulent partir en vacance. Ce besoin de voyage est d’autant plus fort que le coût d’un trajet numérique Boston / Bangalore tend vers zéro. Et puis après tout, n’est ce pas dans notre nature de partager, copier, diffuser l’information ? Nous sommes des primates, nous apprenons par mimétisme. Et dans un monde hautement interconnecté et numérique, où il n’a jamais été aussi simple d’apprendre et de partager, notre nature reprend le dessus.

Je crois profondément que nous sommes à l’aube d’une ère nouvelle. De grands scientifiques, des philosophes, des politiques, parfois même des journalistes comparent l’avènement du web à l’imprimerie. Et quand on se penche sur les implications de l’invention de l’imprimerie sur nos sociétés, on peut se poser la question suivante: vers quelle révolution allons-nous ? Je ne me lancerais pas dans des prospectives douteuses, mais les transformations auront lieux à tous les niveaux. Touchant profondément l’économie, les business modèles de secteurs entiers (ça a déjà commencé), mais aussi la nature même de nos sociétés et le fonctionnement des états. Sur internet il n’existe plus aucune frontières, aucunes, car les données sont tous les jours de plus en plus libres. Libres d’être crées, envoyées, modifiées et copiées.

Malheureusement (heureusement?), la vitesse de ces changements dépasse beaucoup de monde. Et oui le web est jeune, le web grandit vite, ça mange à cet âge là ! 18 ans, le web a encore très peu de poiles au menton mais compte bien faire parler de lui. Chaque nouvelle révolution technologique est systémique et générationnelle, et c’est là ou je veux en venir. Le web va bientôt atteindre sa 20ème année et commence à prendre en maturité. Les moins de 18 ans, “la génération web2.0″ comme j’aime les appeler, rentrera dans quelques années sur le marché du travail. Comme le disait Carlos Diaz, “les entreprises et la société vont devoir d’adapter car leurs modes de communication et leur vision du monde est bien loin des vieux modèles”.

Le monde change vite, trop vite. Il suffit de se pencher sur les derniers événements de la blogosphère pour s’en rendre compte avec des procès contre des bloggeurs et des plateformes d’information et même des menaces contre de simples commentateurs. La palme revient aux pressions des lobbies Américains sur le gouvernement Suédois pour faire fermer des réseaux de Peer-to-Peer. La vielle économie sent une menace arriver sans bien la comprendre.

Et dans tout ça. La nouvelle version du web est en préparation. Crée directement par l’inventeur de génie du World Wide Web: Tim Berners Lee. Via le W3C, Berners Lee, perfectionne ce nouveau moyen de partager des données de manière universelle entre des sites webs. Pour enfin accomplir la vision qu’il a eu en 1990, et reprise dans sa définition du GGG, une base de données mondiale de connaissances. Le web 3.0 sera sémantique ou ne sera pas.

Pour compléter cet article j’ai republié cet excellent reportage:


La discussion est ouverte.

by Nicolas at April 28, 2008 12:41 PM under WebSemantique

del.icio.us

semantic wave 2008 report

état de l'art sur le web sémantique, le projet RDFa présenté par TBL et son équipe. "Linking OPen data"

by vapeug at April 28, 2008 09:45 AM under WebSemantique

del.icio.us

Why RDFa is the only Web scaleable metadata format for next-generation search engines

Comparaison RDFa/Microformats, à l'occasion de la sortie du nouveau moteur de recherche de Yahoo! SearchMonkey (qui utilise les microformats).

by vapeug at April 28, 2008 09:12 AM under WebSemantique

del.icio.us

Bibleref Markup

Bibleref is a simple approach to automatically identifying Bible references that are embedded in blog posts and other web pages. This enables search engines, content aggregators, and other automated tools to correctly label the references.

by vapeug at April 28, 2008 09:07 AM under WebSemantique

April 27, 2008

Christian Fauré

Nouvel enregistrement de Bernard Stiegler

Emmanuel Moreira et Amandine Andre me signalent leur documentaire audio : “En compagnie de Bernard Stiegler“.

L’occasion pour moi de saluer le site Audioblog d’Arte-Radio.com, et plus précisément la revue radiophonique A bout de souffle qui contient des émissions audio de grande qualité (disponibles en Podcast).

D’une durée de 2h36, ce documentaire laisse largement la parole au philosophe, et des éclairages pertinents sont proposés avant les entretiens ou les enregistrements audio de prise de parole en public.

by Christian at April 27, 2008 09:45 AM under Divers

April 26, 2008

David Larlet

L'évolution du web 3.0

Merci Xavier pour la découverte de cette présentation. J'aime bien la notion de « portable personal web ». Ah, que nous sommes nombrilistes :-).

by David Larlet at April 26, 2008 05:35 PM

April 25, 2008

David Larlet

RDF store et Django

Mostly, QuerySet does not poke at the internals of Query: it uses “public” methods only. This is deliberate. It means that writing something like a Query class for a different sort of backend (RDF store, or LDAP or whatever) might very well be possible.

D'après Malcolm, enfin une bonne raison de tester la branche queryset-refactor.

by David Larlet at April 25, 2008 01:55 PM under WebSemantique

David Larlet

★ Le point sur RDF et RDFa

À lire les comptes rendus de Samuel Martin et Nicolas Le Gall, je me suis vraiment mal exprimé lors de ce dernier WaSP Café consacré au Web Sémantique (j'ai actualisé la liste des ressources au passage). Je m'en excuse et je vais essayer d'être plus clair à l'écrit. Quoi qu'il en soit c'était une très bonne expérience sur ma difficulté à exprimer certains concepts.

Problématique

Le principal objectif du web sémantique est d'aider les machines à « comprendre » la complexité humaine. Idée singulière ? Pas vraiment si l'on considère que l'outil informatique pourra ensuite à son tour nous rendre service en proposant des informations plus pertinentes par exemple.

Cette aide est-elle vraiment nécessaire ? Le système actuel a montré ses limites, il est très difficile pour un moteur de recherche de trouver des résultats pertinents lorsqu'une requête est dénuée de contexte et/ou s'avère trop compliquée. En cherchant le terme « Paris » , vous allez être confronté à des résultats portant sur la ville, une suite d'hôtel et bien sûr la personnalité que nous envions aux américains. De la même façon, si vous souhaitez connaître tous les amis des personnes ayant commenté sur votre blog, il va actuellement vous falloir quelques heures (dans le meilleur des cas).

Solution(s)

Il y a plusieurs approches pour essayer de donner davantage de sens, de sémantiser le web. Les deux plus notables sont celle du Semantic Web Interest Group initiée par le W3C et celle des microformats créés par Tantek Çelik (entre autres).

Commençons par les microformats qui ont eu leur heure de gloire. L'idée initiale était d'annoter l'existant afin d'ajouter du sens à la volée lors de la création de nouveaux contenus. C'est une approche louable dans le sens où elle est très pragmatique et permet de commencer à ajouter du sens à certaines données rapidement (notamment grâce à la compatibilité html4). En revanche, outre les problèmes d'accessibilité soulevés, elle pose le problème de la pérénnité de ces formats qui ont une évolutivité assez restreinte (sans parler de la centralisation). Bon je vais pas aller plus loin, ce n'est l'objet de ce billet et Karl l'a fait bien avant moi.

Le SWIG souhaite davantage considérer le web dans son ensemble comme une gigantesque base de données décentralisée grâce à un format standardisé et flexible : RDF.

RDF introduit la notion de triplets permettant d'établir des relations, voici un exemple pour illustrer ce concept. Prenons le texte suivant :

David rédige un article pour Biologeek intitulé Le point sur RDF et RDFa.

Cette simple phrase permet de créer les relations suivantes :

  • David { est rédacteur de } Le point sur RDF et RDFa
  • Biologeek { publie } Le point sur RDF et RDFa
  • Le point sur RDF et RDFa { est } un Article

À partir de ces triplets (sujet { prédicat } objet), on peut ensuite créer de nouvelles relations : si David est rédacteur de Le point sur RDF et RDFa et Biologeek publie Le point sur RDF et RDFa, David est contributeur de Biologeek. L'autre avantage de RDF c'est que sa structure en triplets est très simple et permet de modéliser n'importe quelle donnée.

Les sujets et les objets peuvent être de différentes natures : texte, date, nombres, ... ou URL et c'est là où ça devient intéressant car cela permet de lier les différentes ressources entre elles (et donc de les distribuer à l'échelle du web). Les prédicats sont issus de vocabulaires, certains sont normalisés et peuvent être étendus en fonction des besoins mais on ne va pas aller plus loin pour l'instant.

Il est important de bien comprendre l'importance de RDF pour saisir toute la portée du Web Sémantique. Si l'on souhaite aller plus loin dans l'analogie de la base de données, les tables sont les différents vocabulaires et les ids sont les URL des ressources, d'où l'importance d'avoir des URL uniques par ressource.

RDF et ses représentations

C'est une confusion que l'on retrouve très souvent : XML n'est qu'une représentation possible de RDF, il existe d'autres syntaxes permettant de représenter du RDF comme N3/Turtle ou N triples qui sont moins utilisées (10 ans de XML laissent quand même quelques outils forts utiles) mais plus lisibles à mon sens.

Et RDFa dans tout ça ?

Le but de RDFa est d'intégrer directement du RDF et donc de la sémantique dans votre HTML. Il suffit juste de mettre les bons attributs à des balises HTML existantes donc ce n'est pas plus compliqué qu'un microformat !

Prenons un exemple concret avec ce blog, tous les billets sont RDFaisés grâce au merveilleux tutoriel de Gautier Poupeau. Ce qui permet d'extraire les données RDF (avec une représentation XML) facilement et sans avoir à dupliquer le contenu, il s'agit juste d'un parsing des pages html générées. Vous pouvez voir la représentation de ces données pour le billet actuel à l'URL http://www.biologeek.com/data/web-semantique/le-point-sur-rdf-et-rdfa.

J'ai un petit soucis encore avec les commentaires que je compte régler ce weekend mais vous pouvez déjà analyser le html (et le code) qui permet d'arriver à cela. Vous allez voir que c'est inhabituel mais que c'est loin d'être difficile pour autant.

Enjeux

En termes de référencement, la question n'est pas de savoir si les moteurs de recherche vont y passer mais quand, il n'y a aucun doute là-dessus et certains expérimentent déjà des choses bien sympatiques. Mais publier pour un moteur de recherche n'est pas une fin en soit. À partir du moment où vous avez la possibilité d'extraire vos données en RDF, les réutilisations sont infinies car vous avez un format permettant de faire des requêtes grâce à SPARQL (je n'entre pas dans les détails ici non plus) ce qui permettrait par exemple :

  • d'extraire tous les billets relatifs au tag web-semantique contenus dans mon aggrégateur auxquels j'ai répondu en commentaire ;
  • d'ajouter à mon fichier FOAF tous les fichiers FOAF des personnes ayant commenté ici ;
  • de récupérer dans les fichiers FOAF des commentaires des billets du tag python de ce blog les titulaires de comptes LinkedIn issus des fichiers FOAF et de faire des demandes de mise en relation (pour mettre une pincée de 2.0).

RDFa n'est qu'un moyen d'introduire d'avantage de RDF sur le web mais les enjeux sont bien plus grands, ces quelques exemples ne sont qu'une mise en bouche des applications possibles.

Le meilleur exemple que je connaisse reste DBpedia qui a extrait l'ensemble des données de Wikipedia au format RDF. Il y a des exemples de requêtes pouvant être effectuées. Je vous laisse imaginer tout ce que l'on peut faire avec (Gautier vous aide si vous manquez d'imagination).

Limites

Les outils sont bien sûrs encore au stade de prototype et je ne m'inquiète pas de ça car ça va rapidement évoluer. En revanche il y a deux problèmes majeurs encore irrésolus :

  • La confidentialité : il manque une couche d'authentification permettant un accès granulaire aux triplets RDF ;
  • La confiance : OpenID me permet de créer un compte mais je n'ai aucun moyen de prouver que c'est bien moi David Larlet qui suit derrière cette URL.

Concernant la confiance, il y a des projets qui sont en train d'être développés introduisant un tiers de confiance (banque, état, etc) et permettant de remédier au problème des clés GPG beaucoup trop geek.

En revanche, concernant la confidentialité je suis assez sceptique car je n'ai pas encore trouvé de solution élégante pour gérer ça et c'est quand même une clé majeur du succès du Web Sémantique...

Epilogue

Je voudrais revenir sur la dernière question posée qui était très pertinente mais on manquait de temps (d'ailleurs c'est vraiment dommage, on aurait dû consacrer plus de temps aux questions/réponses). Je la reformule car je ne m'en souviens plus exactement :

Comment faire dans un web 2.0 pour garder le contrôle sur ses données, son identité ?

J'ai rapidement répondu qu'il fallait absolument commencer par avoir son propre nom de domaine car celui-ci va représenter votre identité en ligne mais le problème est beaucoup plus vaste et j'ai déjà eu l'occasion d'en parler. Chacun place le curseur de sa confidentialité, de sa vie privée au niveau qui lui semble le plus juste. Ça va du réseau local ultra sécurisé à l'étalage de sa vie publique sur Seesmic et autres Twitter.

Tout dépend finalement de votre définition de la liberté (en ligne). Pour ma part, j'aime partager mes connaissances, mais beaucoup moins ce que je fais et/ou pense dans certains domaines plus personnels. Je suis ouvert à la décentralisation mais la technique n'est pas encore prête à ça sans introduire des duplicats de l'information un peu partout et je ne parle même pas de la monétisation sous-jacente. Il faut comprendre ce que ça implique et ensuite assumer ses responsabilités, il ne fait aucun doute que la pseudo-gratuité offerte par ces services peut vous coûter cher...

Pour terminer, je pense que le Web Sémantique souffre de deux problèmes (qui sont très proches de ceux du Logiciel Libre finalement) :

  • le manque de publicité, c'est ce qui a permis aux microformats de se développer aussi vite, il n'y a qu'à comparer les deux sites...
  • l'opposition des entreprises existantes qui ont fondé leur business model sur l'extraction et l'utilisation de ces données, le pire étant que ces entreprises noyautent les initiatives comme Data Portability.

J'espère avoir été un peu plus clair cette fois-ci, en tout cas un grand merci aux organisateurs du WaSP Café, c'était très intéressant de pouvoir en parler mais surtout confronter ces idées avec Frédéric et je pense que ça a beaucoup apporté en vitalité.

by David Larlet at April 25, 2008 12:28 PM under WebSemantique

Nicolas Cynober

Screencast #4: TrueKnowledge, le moteur de questions




TrueKnowledge n’est pas vraiment un moteur de recherche à proprement parlé mais plutôt un moteur de questions. Les requêtes s’effectuent avec un “?” à la fin de vos phrases. Exemple: Quelle est la capitale du Guatemala?. Le service utilise pour l’instant deux sources de données principales. Wikipedia (ou dbpedia?) ainsi que leur propre base de données sémantique. Je trouve pour l’instant le service bien réalisé et j’espère que leur base de données de connaissances va vite grossir pour pouvoir effectuer des requêtes plus compliquées dans la longue traine.

TrueKnowledge est sur un segment de la recherche en ligne et s’attaque directement à Google. Du moins à un type bien précis de recherches. Il ne s’agit pas ici d’améliorer la visualisation de la recherche, de faire de l’esthétique avec de la 3D, mais belle et bien de travailler sur la qualité des résultats.

Encore un service web sémantique à surveiller de près !

by Nicolas at April 25, 2008 11:38 AM under WebSemantique

del.icio.us

April 24, 2008

del.icio.us

Alexandre Passant

Social, mobile, semantic

Monday’s DBpedia mobile presentation at LDOW2008 impressed me a lot. Actually, while I never worked on it, I’m really interested in ways to combine mobile applications, Semantic Web / Linked Data technologies and social networking. Here’s a use case I have in mind for a long time and I’d like to share.

Imagine in can embed a FOAF profile on my mobile phone, or just an URI with owl:sameAs / rdfs:seeAlso links to my main URI / RDF file. When joining a conference, a restaurant or any place where there are some people (and when I’m in a good mood), I allow my phone to deliver my presence and this URI (+ related data) to anyone, while at the same time searching for available URIs and data.

Then, I got a list of URIs, and my phone will suggest me that there’s some people nearby that I must meet regarding some criterias and how our URIs are interlinked. A simple way would be to configure the application with kind of (statement, depth) tuples. For example (foaf:interest, 2) would suggest me all people where one of my foaf:interest is link to one of their foaf:interest with a maximum path of 2. And of course, those paths should be computed using Linked Data and considering the whole SW graph, or GGG, e.g. going through DBpedia, GeoNames of any dataset from the LOD cloud if needed.

But, in some case, paths are not enough, as they can result to unrelevant results (depending on the start URI the path may quickly go towards too generic URIs), or sometimes too much people. For example, at a SW event, I guess it would have suggest me to meet anything since I have dbpedia:Semantic_Web in my profile. A solution could be to have an intelligent context manager in the mobile phone that will check my iCal, find that I’m attending a workshop (or even better, use GPS location, browse upcoming.org or other services to find which event I’m attending), retrieve the workshop homepage in which organizers embedded some RDF data about topics of the workshops (as they eat their own dogfood :), and exclude those URIs (and paths that goes through). To be more accurate, instead of those path tuples, I could also define complex queries, as for example: “People that will present some paper at a conference I’ll attend next month”.
Actually, it’s just a matter of providing all the data, open it, and of course, interlink. But well, “Linked Data is the Semantic Web done as it should be. It is the Web done as it should be“, no ?

by Alex at April 24, 2008 06:54 AM under WebSemantique

April 23, 2008

David Larlet

Biologeek (enfin) propulsé par Django

On pourra dire que j'ai tenu les délais annoncés (j'ai été bien inspiré de ne pas indiquer l'année :-)). Il y aura eu des hauts et des bas niveau motivation avec une très longue période de pause. Petit tour du propriétaire.

Moteur

La motivation finale vient du fait que je ne peux pas mener deux projets personnels de front et celui-ci va me servir de bac à sable pour le second donc je lui ai donné la priorité. Vous voila averti(e)s.

Ça m'a demandé pas mal de temps pour tout peaufiner, l'application django est hébergée par Typhon (si ça rame c'est entièrement ma faute car je suis sur une bête de course) et vous pouvez télécharger le code sur le dépôt mercurial (un énorme merci à Intuxication au passage qui propose un service excellent).

Intérieur

Comme annoncé précédemment, les URL ont changées pour adopter une architecture que je trouve plus logique qui me permet de bien faire la distinction entre ce qui est éphémère ou pas, donnée ou représentation. Normalement toutes les précédentes adresses sont redirigées au bon endroit. N'hésitez pas à me prévenir si ce n'est pas le cas.

Au niveau de la sémantique, j'ai ajouté du RDFa sur les pages d'articles/pensées seuls, j'utilise pour l'instant pyRdfa directement car je n'ai pas réussi à installer rdflib sur une Debian Etch... mais je ne désespère pas. Il y a aussi quelques microformats par-ci par-là aussi, surtout car je souhaitais au départ en parler lors de l'atelier.

La bonne nouvelle pour vous (et surtout moi car j'en avais marre de supprimer du spam à tour de bras) c'est que les commentaires sans modérations sont de retour.

Finitions

La première chose visible c'est un design, je trouve le CSS naked day intéressant mais au quotidien ça risque d'être lassant. J'ai quand même fait le minimum mais je ne suis pas graphiste, c'est un métier à part entière et j'aimerais bien à terme avoir une cohérence/identité avec le reste. Je suis à la recherche d'un bon carrossier ;-).

OpenID n'est pas encore supporté, je voudrais faire quelque chose de plus intéressant en automatisant le processus d'acquisition d'un OpenID par les commentateurs (et en devenant en fait provider). Après il y aura des fonctionnalités additionnelles pour les titulaires d'un compte comme le suivi des commentaires etc.

Il y a un gros travail de contextualisation à faire pour les pages d'agrégation en pointant notamment vers des ressources externes. J'aimerais bien arriver à l'équivalent de l'ancienne page des liens mais pour chaque catégorie. Ça demande pas mal de crawling mais je vais voir ce que je peux faire à partir de FeedJack.

Tour de chauffe

Il y a encore pas mal de détails à régler, les prochaines heures vont sûrement être un peu agitées mais soyez persévérants. Normalement je reçois des mails lorsque vous tombez sur une 404 ou une 500 donc je pourrais corriger au fur et à mesure.

Vous pouvez retrouver l'ensemble des billets consacrés à la refonte django de ce site si vous êtes nostalgique, billets qui devraient normalement s'afficher ci-dessous si j'ai pas foiré mon algo.

Normalement les agrégateurs devraient suivre les redirections, désolé pour le flood par contre...

[edit] : vraiment désolé pour le flood, oublier de mettre la date dans les flux c'était vraiment pas malin. Shame on me.

by David Larlet at April 23, 2008 04:56 PM under WebSemantique

Nicolas Cynober

Hardware 2.0

Voila une nouvelle facette du 2.0 que je viens de découvrir: le hardware. Même avec des lentilles de contacte, rasé de prêt et ayant passé une année à l’ESCP, le geek revient toujours. J’ai décidé de vous en faire profiter (quelle chance…).
Le web 2.0 a changé radicalement les proportions de la toile. Plus de sites, plus de blogs, plus de participatif, plus d’échange, tout simplement plus de trafic. Et gérer 10 ou 20 visiteurs sur votre site internet n’a pas les mêmes implications que 10.000.000 ou 20.000.000.

Le grand champion qui a tout de suite compris cet enjeu technique est Google puisque son réseau de 1 million de machines est un véritable avantage concurrentiel. De même Amazon avec EC2 et S3, révolutionne le monde de l’hébergement. On voit même apparaitre des solutions OpenSource de clustering fonctionnant sur le “computing grid” d’Amazon.

En parlant d’OpenSource, la majorité des gros sites internet utilisent des solutions gratuites OpenSource. La combinaison LAMP (Linux + Apache + MySQL + PHP) est toujours aussi efficace et supporte très bien la montée en charge de sites comme Flickr, Wikipedia ou encore Digg. Il y a différentes façons de faire de l’OpenSource, et ces entreprises ont fait le choix de communiquer sur leur architecture afin d’améliorer le socle technologique sur lequel ils reposent. (Vous me suivez ?) Ils améliorent les langages qu’ils utilisent via la communauté. Vous trouverez donc sans problème des présentations et des livres traitant le sujet.

Autre point intéressant concernant ces architectures obèses. C’est qu’elles ne supportent pas bien le changement. Pour gérer des millions de requêtes vous devez créer une architecture hardware spécifique à votre application.

  1. Je crée ma start-up 2.0
  2. J’ajoute quelques fonctionnalités
  3. Je deviens connu
  4. C’est la merde, mon site devient lent, mes machines suivent pas le rythme
  5. Je scale / optimise mon architecture
  6. On touche plus à rien, on rajoute des serveurs tous les jours, chaque modification fonctionnelle engendre de gros travaux hardware.

Et cela peut expliquer beaucoup de choses:

J’espère que ce billet de geek vous a fait plaisir ;)

by Nicolas at April 23, 2008 11:20 AM under Amazon

del.icio.us

SCRIBO - Communiqué de presse SCRIBO, mars 2008

SCRIBO, projet de logiciel libre pour le traitement sémantique de l'information multimédia, financé à l'issue du 5ème appel à projets des pôles de<sep/>

by vetruve at April 23, 2008 10:07 AM under WebSemantique

del.icio.us

April 22, 2008

Alexandre Passant

Attending WWW2008

I’m currently in Beijing, enjoying WWW2008.

Sunday, Uldis, John and myself gave a tutorial about “Interlinking Online Communities and Enriching Social Software with the Semantic Web“, in which we detailed current state of the art regarding SIOC and related works, like how Enterprise 2.0 or data portability can be enhanced thanks to the Semantic Web, as well as describing various tools that produce or consume Social Semantic Web data. The slides can be browsed online here.

Today, I gave two talks at the LDOW workshop, the first one about the flickrdf exporter, the second one about MOAT, while Uldis talked about SIOC and Linked Data. Slides of both of my presentations are online. It was a great workshop, lots of interesting papers and concrete applications demo. That’s really interesting and encouraging to see so much people deploying Semantic Web technologies in various contexts and for various purposes, from biology to enterprise data integration, and also facing new research issues as URI identification and mappings.

Tomorrow starts the main conference, and I guess - and I hope - that it will be as intense and interesting as those first two days. For those interested in MOAT, I’ll give a talk in the Dev Track - Semantic Web II session on friday morning. And for those who’ve been at the LDOW workshop today, the slides will be a bit different, so you can come one more time :)

by Alex at April 22, 2008 04:55 PM under WebSemantique

del.icio.us

del.icio.us

Christian Fauré

La catégorie " sémnantique " du blog de Christian Faure.

by cyrildruesne at April 22, 2008 08:51 AM under WebSemantique

del.icio.us

del.icio.us

David Larlet

EC2 pour les bioinformaticiens

je viens de réaliser qu'EC2 doit vraiment être une solution rêvée pour lancer un processing coûteux (style repliement de protéine) sur une ferme d'instances.

by David Larlet at April 22, 2008 08:38 AM

April 21, 2008

Nicolas Cynober

Screencast #3: Knowee, web sémantique et identité numérique


Plutôt que d’être une véritable killer-apps, knowee montre bien la philosophie du web sémantique et comment cette dernière s’applique à la gestion de votre/vos identité(s) numérique(s). Je vous conseille une petite relecture de mon premier article sur DataPortability, l’idée est assez semblable: pour être maître de ses données il faut les contrôler, c’est à dire pouvoir les récupérer et les diffuser, bref que ces données soient portables.

Si vous vous intéressez de prêt à l’identité numérique je vous conseille de prendre contact avec Alexandre Passant qui effectue un travail remarquable sur FOAF + OpenID. Vous pouvez aussi lire cet article de Gautier qui présente très bien FOAF.

by Nicolas at April 21, 2008 08:51 AM under WebSemantique

del.icio.us

April 20, 2008

Xavier Lacot

I am not a lord who gives up

Well, show me the way to the next little girl

Have you ever suffered an impossible suffering ? Have you ever felt you were only an artefact, a lost chance ? And then after that, did you finally feel better, recognizing back your world, and the world around ?

Never turn again the back to what you are : it is immensely great, beautiful and rich. Don't forget it, just grow and be proud of what you accomplished. Only you can see and feel what you are seing and feeling, so just be confident : the right persons will see it in you. - Well, show me the way to the next little girl, Flickr

Hey, darling, you told me last time
That I couldn't cry for every time
That you need to protect me as a child
But you never never want to hurt me in my mind

But who are you ?
Who are you, to tell this to me ?
But who are you ?
Who are you, do you really think
That my life hangs just on you ?

Hey, darling, you told me last time
That I need to search in my mind
What is wrong, and which is my crime.
That you can't be sure in my arms

But who are you ?
Who are you, to tell this to me ?
But who are you ?
Who are you, Just go away
If you can't be true

Hey, darling, you told me last time
That real men are starker than what I am
That my life has much more things to see
That my hands have other bodies to touch

But who are you ?
Who are you, to tell this to me ?
But who are you ?
Who are you, let your heart
Really love true

by Xavier Lacot (xavier@lacot.org) at April 20, 2008 11:59 PM

del.icio.us

del.icio.us

The OAI2LOD server : exposing OAI-PMH metadata as Linked data

Explication d'une appli permettant d'exposer un entrepôt OAI vers le linked of data avec un sparql endpoint. L'avènement du Web de données est en marche !

by got at April 20, 2008 01:20 PM under WebSemantique

David Larlet

GTD avec Mail.app et iCal sous OSX leopard

c'est un poil plus complexe mais ça a le mérite de ne rien coûter (autant en ressources système qu'en €).

by David Larlet at April 20, 2008 12:57 PM

Christian Fauré

Table ronde sur le futur des applications Web

La table ronde sur le futur des applications Web, qui a eu lieu dans le cadre du lancement d’eXo WebOS, a été filmé et vous pouvez voir la video sur le blog d’eXoPlatform.

Crédit photo : Didier Girard

Sur la photo :
Michael Chaize (Adobe)
Christophe Lauer (Microsoft)
Eric Mahe (Sun)
Tristan Nitot (Mozilla)
Dave Armstrong (Google)
Benjamin Mestrallet (eXo Platform)
Christian Fauré (Atos Origin)

by Christian at April 20, 2008 06:30 AM under Internet

April 17, 2008

Christian Fauré

Les plates-formes web de développement

Petit à petit, l’écosystème des plates-formes web de développement (DaaS, Developement as a Service) commence à se dessiner.
Dressons une petite liste : il y a Amazon (+Heroku ), SalesForce, récemment Google avec Google Apps Engine, puis de plus petits acteurs comme Bungee Labs, Coghead, Rollbase, et aujourd’hui Intuit.

Même Microsoft semble être de la partie avec l’annonce d’EXP Platform. Ray Ozie est d’ailleurs explicite dans le changement de vision auquel il invite Microsoft :

We have an unprecedented opportunity to run A/B tests with online users and innovate more quickly based on actual user response.
Microsoft needs to shift the culture from planning the exact features to planning a set of possible features, and letting customers guide us
– Ray Ozzie, Chief Software Architect         


Quand on y pense, quoi de plus tentant que de faire faire les développements en crowdsourcing, plutôt que d’avoir à les réaliser soit-même ? C’est une bonne nouvelle car l’accès au développement va se populariser.

Ces plates formes ont un principal indicateur qu’elle doivent suivre : c’est la simplicité et la convivialité de l’ergonomie, et du design, des interfaces de programmation. Car c’est la condition nécessaire pour agréger un nombre important de développeurs qui feront grossir les services et l’attrait de la plate-forme.
Cela sera de plus en plus simple de développer des services web, tout au moins des services de base, et ce, en plus de la simplicité induite par les services d’infrastructure de la plate-forme.

Je crois que c’est là que s’est déplacé l’essentiel de la bataille du web.


Dans cette nouvelle phase, la communauté libre ne devra pas se focaliser sur l’opposition entre “logiciel libre” ou “logiciel propriétaire”, mais plutôt s’organiser pour ne pas rester écarté de l’accès aux codes sources.

by Christian at April 17, 2008 09:13 PM under Internet

del.icio.us

April 16, 2008

del.icio.us