
by Thomas Francart at July 04, 2009 11:11 AM under WebSemantique

by Thomas Francart at July 04, 2009 11:11 AM under WebSemantique
I'm pleased to announce that the W3C SPARQL Working Group has just published the First Public Working Draft of SPARQL New Features and Rationale, i.e. description and motivations of the new features to be included in the next version of SPARQL.
The W3C SPARQL Working Group has published the First Public Working Draft of SPARQL New Features and Rationale. This document provides an overview of the main new features of SPARQL and their rationale. This is an update to SPARQL adding several new features that have been agreed by the SPARQL WG. These language features were determined based on real applications and user and tool-developer experience. (Via W3C Semantic Web Activity News)
If you're implementing SPARQL engines, please note that the current syntaxes for each features are example syntax, and then should not be considered as final in any way. Any comments regarding this draft are welcomed by e-mail to public-rdf-dawg-comments@w3.org.
The power to read the language of the environments was the province of the seer in primitive societies; he related the languages which he discerned in the outer world to the inner world, keeping both as a divine secret committed to him.
McLuhan, Marshall, War and peace in the global village. p.59, McGraw-Hill, 1968.
En 1998, un workshop du W3C a eu lieu sur le thème du futur de HTML : Shaping the Future of HTML. Les discussions ont été animées et intéressantes. Malheureusement, le procés-verbal des discussions n'est pas publique. J'ai envoyé un mail pour savoir s'il était possible de les rendre publique. Cependant le message du workshop fût de passer à une grammaire XML pour définir le langage du Web et faire table rase des problèmes du passé. Notamment le problème du support partiel du langage dans les navigateurs et le manque d'éditeur facile à utiliser. Les discussions sont d'ailleurs assez semblales à celles qui sont débatues aujourd'hui sur la liste public-html. Le ton est différent, les discussions y sont plus matures et responsables. Un des points concernait l'extensibilité. XHTML 1.0 (en français) est publié le 26 janvier 2000. Oui au moment de la bulle internet, nous utilisions html 4. Je me souviens que j'ai commencé la traduction et finit en quelques jours à l'époque comme volontaire, je commençais tout juste à travailler chez Angie Interactive avec Edith Nuss et puis je quittais après la réponse surprise du W3C à ma candidature.
En 2004, un nouveau workshop sur le futur des applications Web intitulé W3C Workshop on Web Applications and Compound Documents. Le but était de pousser un peu plus loin la conversion à XML et de modulariser les technologies et les interactions. Cette fois ci, on peut accéder au procés verbal ainsi qu'un résumé des discussions. La question 3 révèle une différence de position entre les membres du W3C. 8 contre 11 et 8 contre 14. La décision fût de prendre la voie de XML et de ne pas développer d'extensions applicatives à HTML. C'est le rendez-vous manqué et l'annonce du WHATWG qui décide de lancer le travail sur un nouveau langage compatible avec ce que font les navigateurs Web. Ils l'appellent Web Applications 1.0. Le groupe est constitué de la nouvelle génération du Web, des ingénieurs des compagnies Apple, Opera et Mozilla : Anne van Kesteren, Brendan Eich, David Baron, David Hyatt, Dean Edwards, Håkon Wium Lie, Ian Hickson, Johnny Stenback, Maciej Stachowiak.
En mars 2007, après de longues négociations et discussions internes, le groupe HTML du W3C repart avec les membres du groupe WHAT afin de créer HTML 5. En parallèle le groupe html ancien qui travaillait sur XHTML 2.0 est maintenu afin de définir un langage moderne pour le futur. Le mois d'avril voit passer 1773 messages sur la liste public-html. Depuis septembre 2007, le niveau n'a jamais redépassé 1000 messages. Les discussions sont actives, chaudes, parfois intéressantes mais rarement. Entre intérêts de pouvoir, commerciaux, d'ego (méritocratie), etc. les participants avancent leurs pions. Le débat est difficile à suivre si l'on est pas payé pour et donc un biais s'introduit dans la participation. C'est une communauté d'intérêts très particulière. De nombreuses personnes ont abandonné la discussion. Ceci dit, de nombreuses choses dans la spécification qui est un brouillon sont très intéressantes. Il faudra attendre la phase de CR pour les parties vraiment spécifiques si elles seront maintenues ou poussées vers une version ultérieure.
Daniel Glazman a souvent parlé de XHTML 2.0 comme d'un canard. Cela nous a valu plusieurs prises de bec mémorables. Cependant à la vue de ce qui se passe dans le groupe de travail, je ne peux m'empêcher de penser que Daniel n'avait pas tout à fait raison, et que je n'avais pas tout à fait tort. Cela nous donnera l'occasion d'une discussion à ParisWeb 2009. ParisWeb est une conférence organisée par des gens talentueux et avec des discussions toujours intéressantes. Venez nombreux. Ceci dit XHTML 2.0 n'avait que peu de chances de succès dans le domaine du Web ouvert depuis que les fabricants de navigateurs ont déclaré formellement ne pas vouloir implémenter XHTML 2 et concentrer leurs efforts sur HTML 5. Une décision a finalement été prise de fermer le groupe de travail XHTML 2. Nombreuses idées de XHTML 2.0 sont reprises dans le document de HTML 5. cela va clarifier le message auprès de la communauté.
Dans toute cette aventure, ce que j'ai appris le plus, ne fût pas vraiment la technologie, mais bien la vie et les relations tribales de pouvoir des communautés.
Sous le titre un peu provocateur L’inutilité des logiciels libres à l’heure du Web 2.0, j'aurais la chance de pouvoir m'exprimer sur le thème suivant :
Libristes convaincus, où stockez-vous vos données ? N’êtes-vous pas en train de donner bien volontiers d’une main ce que vous vous acharnez à récupérer de l’autre ? Comment le Libre peut-il encore tirer son épingle d’un jeu qui suit actuellement les règles de Google, Facebook, Amazon & Co ?
C'est à Nantes, le samedi 11 juillet et ça commence à 15h mais il y a plein de confs super intéressantes toute la semaine donc n'hésitez pas à passer une partie de vos vacances dans notre merveilleuse Bretagne (oui j'ai un quart breton, ce qui explique certaines choses. Ou pas.) J'y serais dès le vendredi si vous voulez discuter de choses et d'autres :-).
Discussion aux RMLL autour des applications/données libres
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 02 juillet 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
Je suis actuellement sous l’eau avec pearltrees: nous allons bientôt sortir une nouvelle version (code name: redbull). Les publications reprendront très prochainement, SemTech2009, différences entre LinkedData et Ontologies et avenir de la presse sont au programme !
De retour de vacances, mon mémoire de thèse (pdf, licence CC BY-NC-ND) et les transparents de la soutenance (qui s'est très bien passée ;-) sont enfin en ligne.
Merci encore à tous ceux qui sont venus / m'ont encouragé / questionnés et avec qui j'ai pu travailler ces dernières années dans le cadre de cette thèse ... l'aventure ne fait que commencer !
Puis une dame, à sa haute fenêtre,
Blonde aux yeux noirs, en ses habits anciens,
Que dans une autre existence peut-être,
J'ai déjà vue... et dont je me souviens !de Nerval, Gérard, Fantaisie,
J'ai parlé aujourd'hui de mon expérience de réarrangements des pixels d'hier avec Olivier. Il a été intéressé donc comme deux enfants sur les chemins buissonniers, nous avons testé plusieurs solutions.
Dans tous les cas, on remarque un arrangement logique des couleurs mais toujours avec du bruit. Pour isoler une source de bruit, Olivier a décidé de mettre la brillance à 1. La brillance à 1 représente un maximum de luminosité. Ceci fait on obtient un tri légèrement différent mais toujours avec du bruit.
Cette fois ci, on décide de trier sur deux valeurs la teinte et la saturation. Puis l'on fixe la saturation et la brillance au maximum (100%). On obtient alors ce spectre uniforme et saturé (normal).
Mais souvenez-vous, mon but d'hier était d'identifier les photos en fonction de leurs dominantes de couleurs. Voyons cela.
Il y a encore beaucoup de choses à corriger. Nous avons identifié quelques erreurs possibles, il faut donc faire des tests.
Programme python de conversion de couleurs et d'affichage de l'image
#!/usr/bin/env python
# encoding: utf-8
"""
jpeg2spectrum.py
Created by Karl Dubost, Olivier Théreaux on 2009-06-30.
Copyright (c) 2009 Grange. All rights reserved.
"""
import sys
import getopt
import colorsys
from PIL import Image
help_message = '''
This code converts a Jpeg image in a series of colors'''
class Usage(Exception):
def __init__(self, msg):
self.msg = msg
def readingImage(imagefile):
"""read a simple image and convert it to a sorted HSV spectrum"""
colors = []
spectrum = []
im = Image.open(imagefile)
xsize, ysize = im.size
print xsize, ysize
pix = im.load()
for x in range(xsize):
for y in range(ysize):
# gives a RGB triple
colors.append(pix[x,y])
# conversion vers HSV (valeur entre 0 et 1)
for color in colors:
spectrum.append(colorsys.rgb_to_hsv(color[0]/255.0,color[1]/255.0,color[2]/255.0))
# tri de la liste sur la valeur de v
spectrum.sort( key=lambda x:(x[0], x[1]))
# avec conversion vers un multiple de 255
i=0
for x in range(xsize):
for y in range(ysize):
r, g, b = colorsys.hsv_to_rgb(spectrum[i][0], 1, 1)
pix[x,y]=(int(255.*r), int(255.*g), int(255.*b))
i=i+1
return im
def writespectrum(spectrum, output):
"""create the color spectrum"""
outfile = output + ".jpg"
if infile != outfile:
try:
spectrum.save(outfile, "JPEG")
except IOError:
print "cannot convert", spectrum
def main(argv=None):
if argv is None:
argv = sys.argv
try:
try:
opts, args = getopt.getopt(argv[1:], "ho:v", ["help", "output=", "file="])
except getopt.error, msg:
raise Usage(msg)
# option processing
for option, value in opts:
if option == "-v":
verbose = True
if option in ("-h", "--help"):
raise Usage(help_message)
if option in ("-o", "--output"):
output = value
if option in ("-f", "--file"):
imagefile = value
except Usage, err:
print >> sys.stderr, sys.argv[0].split("/")[-1] + ": " + str(err.msg)
print >> sys.stderr, "\t for help use --help"
return 2
spectrum = readingImage(imagefile)
spectrum.show()
if __name__ == "__main__":
main()
Puis un château de brique à coins de pierre,
Aux vitraux teints de rougeâtres couleurs,
Ceint de grands parcs, avec une rivière
Baignant ses pieds, qui coule entre des fleurs ;de Nerval, Gérard, Fantaisie,
La photographie est révélatrice d'un temps, d'un instant, d'un espace, d'une atmosphère. Les émotions que nous y vivons sont nombreuses, complexes et cachées. Je me suis alors demandé si le spectre de couleurs d'une photo pouvait me donner le ton de mon émotion. Prendre les couleurs et les trier dans un ordre différent. Cette image du soleil sur le mur un matin… est surement différente d'une autre. Alors j'ai écrit un petit programme, loin d'être parfait qui m'a permis de me plonger un peu dans la théorie des couleurs. Des balbutiements de code. Le programme est à améliorer (Soyez libres de copier, modifier, etc). Il n'offre pas encore une perception de linéarité dans la distribution des couleurs.
Programme python de conversion de couleurs et d'affichage de l'image
#!/usr/bin/env python
# encoding: utf-8
"""
jpeg2spectrum.py
Created by Karl Dubost on 2009-06-23.
Copyright (c) 2009 Grange. All rights reserved.
"""
import sys
import getopt
import colorsys
from PIL import Image
help_message = '''
This code converts a Jpeg image in a series of colors'''
class Usage(Exception):
def __init__(self, msg):
self.msg = msg
def readingImage(imagefile):
"""read a simple image and convert it to a sorted HSV spectrum"""
colors = []
spectrum = []
im = Image.open(imagefile)
xsize, ysize = im.size
print xsize, ysize
pix = im.load()
for x in range(xsize):
for y in range(ysize):
colors.append(pix[x,y])
# conversion vers HSV (valeur entre 0 et 1)
for color in colors:
spectrum.append(colorsys.rgb_to_hsv(color[0]/255.0,color[1]/255.0,color[2]/255.0))
# tri de la liste sur la valeur de v
spectrum.sort( key=lambda x:(x[2]))
# avec conversion vers un multiple de 255
i=0
for x in range(xsize):
for y in range(ysize):
r, g, b = colorsys.hsv_to_rgb(spectrum[i][0], spectrum[i][1], spectrum[i][2])
pix[x,y]=(int(255.*r), int(255.*g), int(255.*b))
i=i+1
return im
def writespectrum(spectrum, output):
"""create the color spectrum"""
outfile = output + ".jpg"
if infile != outfile:
try:
spectrum.save(outfile, "JPEG")
except IOError:
print "cannot convert", spectrum
def main(argv=None):
if argv is None:
argv = sys.argv
try:
try:
opts, args = getopt.getopt(argv[1:], "ho:v", ["help", "output=", "file="])
except getopt.error, msg:
raise Usage(msg)
# option processing
for option, value in opts:
if option == "-v":
verbose = True
if option in ("-h", "--help"):
raise Usage(help_message)
if option in ("-o", "--output"):
output = value
if option in ("-f", "--file"):
imagefile = value
except Usage, err:
print >> sys.stderr, sys.argv[0].split("/")[-1] + ": " + str(err.msg)
print >> sys.stderr, "\t for help use --help"
return 2
spectrum = readingImage(imagefile)
spectrum.show()
if __name__ == "__main__":
main()

by Jean Delahousse at June 29, 2009 08:38 PM under WebSemantique
The Unit Social Software (USS) in DERI is currently looking for Ph.D. candidates. Applications must be sent by the end of the week at hr.ie@deri.org and positions will start in September.
More details in the add below:
The Unit Social Software (USS) at the Digital Enterprise Research Institute - DERI: http://www.deri.ie/ - of the National University of Ireland, Galway invites applications for a 4 years fully-funded PhD fellowship position.
DERI is a leading research institute in semantic technologies that offers a stimulating, dynamic and multi-cultural research environment, excellent ties to research-groups worldwide and standardization bodies, close collaboration with industrial partners and up-to-date infrastructure and resources.
The DERI Unit Social Software focuses on the convergence of Social Software and the Semantic Web by developing models and tools that support and take advantage of these two trends. Achievements of DERI USS include SIOC - Semantically-Interlinked Online Communities - and a large number of publications and tutorials on the topic in international venues and journals. USS Research is performed in collaboration with other DERI units and industrial partners. The PhD position is funded by Science Foundation Ireland (http://sfi.ie) within the Lion2 project and offers for the successful candidate an annual stipend, course fees and conference travel when presenting.
Applicants should have a strong interest in Social Software, Semantic Web and Web Science in general and hold an excellent primary degree or Masters qualification in a relevant discipline (e.g. computer science, information
science, knowledge representation), with an emphasis on practical aspects of research (e.g. industrial project experience, ontology development and open-source software developement being distinct advantages). Selected
candidates are expected to have the willingness to combine formal scientific work with application-oriented research and development in projects funded by national and international (EU) funding agencies, as well as participating in
open-source projects and standardization activities.
Please submit your application (including cover letter, relevant publications or software implementation, full CV and contact details for two referees) to hr.ie@deri.org by 5pm on Friday, July 3rd with the subject line 'PhD Position - DERI USS'. Candidates will be contacted in the first week of July and interviews will be then conducted for successful applications. For further information please contact Alexandre Passant (alexandre.passant@deri.org) and John Breslin (john.breslin@deri.org).
J’ai passé ces derniers jours à revoir pas mal de ses vidéos. Un peu comme quand on monte au grenier et qu’on se laisse aller à rêvasser en prenant les vieux objets un par un et en se refaisant l’histoire que chacun porte en lui.
Ce n’est pas sa mort qui m’a « choqué» – il était mort depuis longtemps pour moi – c’est plutôt la force avec laquelle j’ai ressenti ce besoin de tout revoir et de me re-faire le film.
Je suis allé vers ces archives, ces supports de mémoire, parce que, comme beaucoup, je voulais savoir quelle était l’affinité que j’avais avec lui. En revoyant ces images et en ré-écoutant ses chansons je pensais peut-être arriver à donner un nom et à caractériser cette fameuse affinité.
Je suis à présent le premier surpris d’écrire que le sentiment qui prédomine, c’est celui de la culpabilité. Je me sens coupable d’avoir dansé de joie jusqu’à épuisement sur ses chansons, coupable d’avoir chanté à tue-tête pendant des heures jusqu’à me persuader que j’étais arrivé à chanter comme lui, mais surtout coupable de ne pas avoir vu ce qui aujourd’hui me saute aux yeux.
Je me sens coupable d’avoir « consommé» Michael Jackson. Dans ses oeuvres, je suis allé chercher ce dont j’avais besoin tout comme l’on choisi ses produits dans les rayons d’un supermarché : un peu de joie par ci, de la fièvre pour danser par là, de la nostalgie pour accompagner des moments de solitude, etc. Je prenais comme un consommateur qui ne donne rien en retour.
J’ai l’impression que sa voix est comme le chant d’un oiseau en cage, qui chante pour attirer votre attention, pour que vous le libériez. Seulement voilà, l’oiseau chante et danse si bien que, si l’on approche de la cage, ce n’est pas pour le libérer mais pour le regarder et l’écouter égoïstement, en l’applaudissant, mais sans le libérer. Un comportement de consommateur.
Est-ce un hasard si le premier album 33t que j’ai acheté est un disque de Jackson ? Et est-ce un hasard si je l’ai acheté dans un supermarché alors que les grandes surfaces commençaient à peine à vendre des « produits culturels» ?
Mais pourquoi cette culpabilité ? Cela paraît être étrange de se sentir coupable d’avoir apprécié un artiste. Quelle faute peut-il y avoir ?
Je me sens coupable parce que je n’ai pas vu ce qui m’a frappé ces dernières heures. J’y vois à présent ce qui me met en affinité avec lui. Je vois un enfant terrorisé, comme après avoir été arraché à lui-même, mais qui se force à sourire.
Comme si on l’avait littéralement poussé sur scène, sous les éclairages et face au public et que, face à cette situation terrible, sa réaction avait été d’essayer le charme, même forcé, d’un sourire. En de telles circonstances, d’autres auraient pu pleurer, crier, bouder, s’enfuir, s’effondrer, voire même être enthousiasmé. Non, lui était tellement terrorisé qu’il a simplement souri, seul léger mouvement musculaire qu’autorise notre système nerveux quand il est paralysé par la peur.
Et si ses fameux ooohs, formes de soubresauts vocaux qui faisaient son empreinte vocale, n’étaient rien d’autre que les bruits que fait un enfant qui sanglote ?
Il me sera difficile à présent de ne pas ressentir une certaine forme de gêne en le ré-écoutant, de ne pas voir surgir à chaque fois l’image de l’enfant qui appelle à l’aide mais que le talent nous empêche d’entendre, comme sur cet enregistrement d’un concert en 1972 (à Paris, en première partie de Bob Marley) où il chantait Ben :
Lui qui souriait en répétant « I love you» à son public et ses fans qui le consumaient.

by Thomas Francart at June 27, 2009 08:19 PM under WebSemantique
La traduction française est maintenant jointe à la vidéo officielle. Pour ceux qui auront raté cette présentation, c’est le moment de se rattraper !
J’en profite pour faire un appel aux gens qui ont suivi la conférence SemTech2009. Vous y étiez? Vous avez lu des opinions intéressantes? Je construits une carte sur le sujet en prévision d’un article à venir, laissez vos liens en commentaire ou envoyez les moi directement dans pearltrees.

by Thomas Francart at June 25, 2009 07:33 AM under WebSemantique
Il y a une tendance qui n’a certainement échappé à personne, c’est la complexité croissante, je ne dis même plus du prix mais du système tarifaire des produits et services. C’est d’ailleurs une remarque que m’a faite Yves Marie Pondaven à propos de l’aberration de certaines politiques tarifaires dans l’IT. Il est vrai que, dans le milieu de l’informatique, on est plutôt bien servis.
J’ai arrêté d’essayer de comprendre les mécanismes de CAL de Microsoft ou encore les systèmes modulaires et les options de SAP. De toute façon on se trompe toujours, à croire que ceux qui réfléchissent aux tarifs chez les éditeurs doivent se dire :
« si quelqu’un comprend mon mécanisme tarifaire, c’est qu’il n’est plus bon et qu’il est temps d’en changer» .
Tout est fait pour qu’il n’y ait pas de comparaison possible avec d’autres produits ou services, car une marque tend à vouloir se rendre incommensurable avec les autres marques. D’ailleurs, l’ensemble de la stratégie marketing est bien souvent guidée vers la recherche d’un avantage compétitif singulier et différenciant. Dites à un éditeur de logiciel qu’il est en concurrence avec un autre et il vous répondra que non, il est sur un positionnement différent, et que ce n’est pas comparable, etc.
Si l’on sort du périmètre retreint du monde de l’IT, on constate que la multiplication des produits et de leurs déclinaisons nous met face à un « hyperchoix» qui risque de paralyser l’acte de choix dans la consommation. Ainsi j’ai récemment achété un appareil photo et le choix entre Sony, Nikon, Cannon, etc. n’a pas été une mince affaire : c’est un véritable projet comparatif qu’il faut mener ! C’est ce que souligne magnifiquement Marie-Anne Dujarier dans son ouvrage Le travail du consommateur où elle parle de l’acte d’achat dans une société de l’hyperchoix :
« Quel que soit le produit, l’offre est devenue complexe, foisonnante, diversifiée, « multicritérisée» . Elle change à des rythmes accrus, est disposée de manière à « piéger» le consommateur et rend le plus souvent la comparaison impossible» . p.157
Mais, comme le soulignaient F. Larceneux et R. Berger en 2006, dans « Tests statistiques sur l’hyperchoix et les stratégies du consommateur» (télécharger l’étude en PDF), le nombre croissant de produits disponibles et leurs déclinaisons associées placent le consommateur
« dans une situation d’hésitation et d’incompréhension de l’offre, ce qui peut même conduire à ne plus acheter»
Alors forcément, je ne vous étonnerai pas si je vous dis qu’en tapant « comparison» dans google on obtient 179 millions de résultats. Car il y a toute une industrie de la comparaison des produits et services qui s’est mise en place : test, banc d’essai, comparateur de prix, forum, etc. Tout est là pour « aider» le consommateur à faire son choix face à l’hyperchoix. Cela n’est d’ailleurs pas propre au web, regardez chez n’importe quel marchand de journaux, et vous observerez le pourcentage des magazines qui sont là pour vous accompagner dans votre choix : tests des produits ou services, avis d’experts, retours d’expérience des lecteurs au sujets de : photo, vidéo, informatique, jeux vidéo, placements financiers, habitat, immobilier, produits de beauté, etc.
Les critiques de littérature et de cinéma sont peut être les premières figures de cette industrie de la comparaison qui ne cesse de croître et de muter durant le XX° siècle pour en arriver au constat fait récemment par des revues de défense des consommateurs qui « observent régulièrement que la comparaison des tarifs (bancaires, assurances, services..) relève maintenant de l’exploit.
La logique qui se met ainsi en place consiste à paralyser les processus cognitifs des consommateurs pour que le choix ne puisse plus être rationnel. L’entreprise concentre sa capacité marketing à créer des systèmes tarfiaires d’une complexité croissante. Ainsi, le prix devient de plus en plus un algorithme, comme c’est le cas notamment avec le « yield management» qui fait varier le prix selon le temps et qui amène le consommateur à « comparer des tarifs qui évoluent à mesure qu’il les étudie» . Cela devient un algorithme car, un prix, cela a une élasticité : il y a un prix plancher et un prix maximum pour chaque produit et le « juste prix» , pour l’entreprise qui vend, se situe entre ces deux extrêmes qui définissent l’amplitude du prix au delà de laquelle le produit risque de décrocher et de ne plus être viable sur le marché (baisser un prix pour vendre plus n’est pas une règle qui marche systématiquement, et revenir en arrière peut être désastreux).
Vers où cela peut-il nous mener ?
je pense qu’après la phase de multiplication des produits et services en une combinatoire infinie, l’objectif va être de pouvoir faire payer le même produit ou service plus ou moins cher en fonction d’un nombre plus important de critères : toutes les données collectées sur l’acheteur, le moment, le mode et le lieu d’achat. Car ce que le marketing sait, c’est que pour un même produit, le désir d’achat n’est pas le même pour tout le monde. La question est donc : comment faire payer plus à ceux qui sont prêts à le faire, et moins aux autres. C’est à dire comment exploiter au maximum toute l’amplitude des degrés de facturation qu’autorise l’élasticité du prix sans être contraint d’afficher un prix unique, correspondant à une moyenne non optimisée.
La vieille loi de l’offre et de la demande relève bien sûr de cette tendance au « devenir algorithmique des tarifications» , mais elle prend une toute autre dimension à présent avec la connaissance que les entreprises ont des comportements individuels des consommateurs. On est passé de la loi de l’offre et de la demande à la loi des offres et des demandes. Maintenant que la récupération de nos traces est devenue une réalité en terme de data collectées, il va falloir faire tourner de nouveaux algorithmes capables d’exploiter ces nouvelles données issus du domaine de la discrétisation due au processus de grammatisation (celles de nos pratiques numériques aujourd’hui, mais aussi celles de nos activités au sens large avec l’internet des objets demain). Les algorithmes travaillent à présent avec les sommes infinitésimales des informations collectées sur des consommateurs avec la promesse de pouvoir dire :
« pour Mme Michu, ce produit coûte tant d’euros, à l’instant où je vous parle» .
Mais d’autres stratégies sont possibles : Free, dans un domaine où l’offre de service était loin d’être simple, à lancé un pavé dans la marre avec son offre simplissime indiquant un prix unique pour l’ensemble de leurs services de fournisseur d’accès à internet. Dans le domaine du logiciel également, Google annonce des tarifs pour les entreprises qui sont publics et se présentent sous la forme d’un prix unique par utilisateur comprenant tous les services. La mouvance des low cost joue également sur la clarté et la simplification de l’offre.
A toute tendance, sa contre-tendance : et dans la publicité, on voit tout de suite le positionnement de la marque sur ces questions d’offre tarifaire : soit la pub matraque son message en affichant la simplicité de son prix et de son offre (les pubs Free) soit la pub est décalée par rapport au produit, elle le sublime (type Air France) pour non seulement donner envie d’acheter mais également donner envie d’être prêt à le payer plus cher.
Il arrive un moment dans les communautés (au moins techniques) où, passé un seuil critique que j'estime à une cinquantaine d'individus (sur IRC), la relation symbiotique d'entraide tourne au simple parasitisme. Les parasites n'ont pas envie de lire la documentation, de chercher à comprendre, de partager leurs expériences et leurs connaissances.
C'est dommageable car c'est le moment où les personnes motrices commencent à être découragées : tout ça pour ça. Et passent à autre chose, plus petit, plus symbiotique, plus humain. Les parasites auront eu raison, non pas de la communauté, mais au moins de son intérêt.
J'ai pu vérifier ça deux fois pour l'instant.
Symbiotes et parasites
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 23 juin 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
Une montre cela ne remplit pas l'estomac…
Yoshida, Kiju, La Source thermale d'Akitsu, 1962.
L'homme sans travail dans un pays ruiné par la guerre vend son temps pour une bouteille de sake. Noyer son inutilité dans l'alcool, dans le dégoût du temps mesuré. Échapper à cette mesure du temps comme seul espoir.
La feuille de temps mesure et calibre les individus. Elle les assoie dans un rôle, dans un processus. Elle définit la tâche, va même parfois jusqu'à la justification d'une expertise. La récolte des heures comme une navigation amère sans boussole mène à peu de choses si ce n'est que l'on ne gère plus son temps mais que celui-ci prend tout l'espace de notre existence.
Il faut alors recréer cet espace libre sans tic-tac, cet espace de déambulation. Pas de téléphone, pas de montre, pas de réveil, juste la lumière des jours qui passent et des ombres de la nuit. Ne pas décider du moment, juste se laisser glisser sur la journée. Hier soir, Kiju Yoshida et la source thermale d'Akitsu donna l'espace d'un temps accompagné de Mariko Okada.
Et que jamais il ne fût tenté de secouer cet implacable silence par quelque violence de langage…
Vercors, p. 43 Les silences de la mer. Published by a special agreement with "Les Cahiers du Silence", London. Les Éditions de Minuit, 1942. Éditions Jacques Schiffrin
Le 21 janvier dernier, Stéphane me posait une question à propos du titre du livre de Vercors. Oui je peux prendre plusieurs mois pour répondre à un message. Mes silences ne sont que des respirations entre les mots. Je lisais ton dernier billet qui aborde en dernière partie le livre de Vercors et j'ai un petit étonnement. Le livre que j'ai chez moi titre "Le silence de la mer". Étant donné que tu as une photo de la première page, il n'y a pas de doute que le tien est bien "LeS silenceS de la mer". Est-ce que ton livre contiendrait une information sur cette différence ?
Je recopie la note de l'éditeur contenue dans le livre.
La première édition des Silences de la Mer fut imprimée sur les presses clandestines des Editions de Minuit. Elle porte la mention suivante :
Editions de Minuit. Ce volume publié aux dépens d'un patriote, a été achevé d'imprimer sous l'occupation Nazie, le 20 février 1942.En avril 1943, les avions de la Royal Air Force lançaient sur la France le Numéro 4 de La Revue du Monde Libre (dont nous reproduisons en fac-similé la couverture à la page précédente) avec, au sommaire, Les Silences de la Mer.
Les Cahiers du Silence, publiés en langue française à Londres, par C. Divonne de Boisgelin, donnèrent en juin 1943 l'édition préfacée dont, avec l'autorisation des éditeurs, nous avons adopté le texte.
Le titre que porte le Récit de Vercors est, dans l'édition de Londres : Le Silence de la Mer. Dans La Revue du Monde Livre : Les Silences de la Mer. N'ayant pas la possibilité de consulter le manuscrit, nous avons choisi ce dernier titre.
Vercors, Les silences de la mer. Published by a special agreement with "Les Cahiers du Silence", London. Les Éditions de Minuit, 1942. Éditions Jacques Schiffrin
Ne craignons pas le détour.
Il faut que les Orgues grondent,
pour que la musique abonde
de toutes les notes de l'amour.Rilke, Rainer Maria. C'est qu'il nous faut consentir
iTunes conserve le catalogue de votre musique dans un fichier au format XML iTunes Music Library.xml. Le fichier utilise le format plist de Apple, qui est un format idiot, comme du JSON, de structure de couples de valeurs et non pas sémantique. Chaque morceau contient une redondance d'information inutile. Typiquement, un format utilisant RDF auraît été beaucoup plus intelligent ou au moins un format XML comme celui de MusicBrainz. À noter que MusicBrainz est passé de RDF à XML. Les utilisateurs trouvaient que le format RDF était trop complexe.
Format XML pour un morceau dans iTunes
<key>597</key>
<dict>
<key>Track ID</key><integer>597</integer>
<key>Name</key><string>I Should Care</string>
<key>Artist</key><string>Thélonious Monk</string>
<key>Album</key><string>The Essential Thelonious Monk</string>
<key>Genre</key><string>Jazz</string>
<key>Kind</key><string>Fichier audio AAC</string>
<key>Size</key><integer>1936001</integer>
<key>Total Time</key><integer>117466</integer>
<key>Disc Number</key><integer>1</integer>
<key>Disc Count</key><integer>1</integer>
<key>Track Number</key><integer>12</integer>
<key>Track Count</key><integer>12</integer>
<key>Date Modified</key><date>2008-03-20T12:21:08Z</date>
<key>Date Added</key><date>2008-12-03T15:46:23Z</date>
<key>Bit Rate</key><integer>128</integer>
<key>Sample Rate</key><integer>44100</integer>
<key>Sort Album</key><string>Essential Thelonious Monk</string>
<key>Persistent ID</key><string>8132ACB29075F26D</string>
<key>Track Type</key><string>File</string>
<key>File Type</key><integer>1295270176</integer>
<key>File Creator</key><integer>1752133483</integer>
<key>Location</key><string>file://localhost/Users/karl/Music/iTunes/iTunes%20Music/The%CC%81lonious%20Monk/The%20Essential%20Thelonious%20Monk/12%20I%20Should%20Care.m4a</string>
<key>File Folder Count</key><integer>4</integer>
<key>Library Folder Count</key><integer>1</integer>
</dict>
Il peut être intéressant d'extraire les informations de votre catalogue afin de le convertir en RDF, ou de présenter le catalogue de musique en HTML, de compiler des statistiques ou encore de créer des graphiques de toutes sortes. Voici le squelette d'un programme simple pour extraire le nom des artistes.
Programme python
#!/usr/bin/env python
import plistlib
itunesfiles = 'iTunes Music Library.xml'
try:
from Foundation import (NSDictionary)
d = NSDictionary.dictionaryWithContentsOfFile_(itunesfiles)
except:
d = plistlib.readPlist(itunesfile)
artistslist = d['Artist']
for artist in artistslist:
print artist
Bien sûr, il faut ajouter un filtre sur la redondance des noms d'artistes dans ce cas. Il existe un autre fichier, iTunes Library Extras.itdb qui conserve l'information de CDDB GraceNote et qui semble au format SQLite3. Cependant attention, Apple a la mauvaise habitude de changer les formats des fichiers sans forcément documenter qu'ils ont changé le format.
Je ne laisserai pas se faner les pervenches
Sans aller écouter ce qu'on dit sous les branches
Et sans guetter, parmi les rameaux infinis,
La conversation des feuilles et des nids.Hugo, Victor. Mai
2000 me semblait si loin et pourtant la date, sur mon carnet de notes, indique déjà 2009. 21 juin. Le printemps est là. Dans la ville, le chuchottement oral, dans le monde numérique, le brouhaha de nos conversations coule, se déroule et s'oublie. Nous avons tant d'attachements à la notion de l'écrit que nous avons l'obsession de garder, enregistrer nos conversations du type microblog. Et pourtant… les conversations numériques ne sont pas plus ou moins intéressantes que nos conversations orales, celles que nous oublions pour l'essentiel. Et celles du passé, les BBS, les échanges sur le minitel, les conversations sur IRC sont pour la plupart disparues.
Aller de l'avant, apprendre à ne pas avoir peur d'oublier et surtout créer une stratégie de la conservation. Nous conservons tout parce que ce n'est pas plus cher, juste quelques disques de plus. Nous n'établissons pratiquement jamais de stratégie de conservations. De la poussière numérique sur nos disques ou ailleurs loin dans un nuage pixellisé, un brouhaha sédimenté qui ne sert finalement pas à grand chose, juste peut-être un anxiolytique.
Aujourd'hui une longue journée de printemps, un nouveau frémissement de mots, c'est le printemps.
Du monde hein ? Moi je suis fan
Pas forcement pour la musique en elle-même mais plutôt sur leur manière de communiquer (comunier) avec leurs fans. Dans leur dernier billet de blogue, les 2 compères ont publié quelques photos de tournesoles, allez voir pourquoi… J’attends les résultats de la tournée, j’espère que la peche production dévoilera quelques chiffres.
Peut-être avez-vous déjà eu cette discussion où l’on évoque ses souvenirs d’enfance jusqu’au moment où l’on en vient à se demander quel est le premier souvenir.
Le tout premier, le plus ancien dont vous avez gardé la trace, qui remonte généralement à la période de vos 3-4 ans.
Moi, c’est le souvenir d’être à l’arrière du solex de mon père qui m’amenait à la maternelle par une froide matinée d’hiver. C’est le froid qui m’a pour ainsi dire éveillé à moi-même, inscrit en moi un premier souvenir durable.
Pour d’autres c’est le désespoir d’un premier jour de maternelle où il faut quitter maman, ou encore une plage en été où le soleil vous brûle la peau.
Et vous ?
by serge.esteves at June 19, 2009 11:34 PM under WebSemantique

by Thomas Francart at June 19, 2009 02:51 PM under WebSemantique
Si le Web 2.0 a permis le développement sur le Web d'une certaine forme d'intelligence collective avec des initiatives tels que Wikipedia, il a aussi, dans de nombreux cas, induit une captation des données par des sociétés commerciales.
En offrant des mécanismes standardisés de structuration, de mise à disposition, d'échanges et d'interrogation des données à l'échelle du Web, les technologies du Web sémantique permettent de mieux exploiter toutes les données créées et mises à disposition sur le Web et offrent aux utilisateurs un moyen de reprendre le contrôle de leurs données, en leur rendant leur capacité de choix.
Il y a quelques années, les utilisateurs du Web se le sont réappropriés au fur et à mesure grâce à une utilisation plus stricte des standards CSS et HTML, entre autres, causant en partie la remise en cause de la stratégie de Microsoft sur le Web (même si ce n'est pas encore complètement gagné). Gageons que l'appropriation et l'utilisation des standards du Web sémantique amèneront les Google, Facebook et consorts à remettre en question leur stratégie de main mise sur les données des utilisateurs.
Les technologies du Web sémantique et le Web de données (le Web 3.0 ??) seront-t-il les sauveurs des idéaux du Web 2.0 ? Personnellement, je ne me pose plus la question, j'en suis convaincu.
En guise d'arguments, je vous propose une petite application : « la boîte à souvenirs » dans laquelle j'ai utilisé les technologies du Web sémantique pour récupérer et valoriser mes données de Flick'r et les données mises à disposition par l'ensemble de la communauté de Wikipedia.
J'invite les personnes qui voudraient en savoir plus à consulter la description de l'application qui décrit précisément mes besoins et les moyens que j'ai mis en œuvre pour y répondre.
<!--break-->Une citation issue de Mon CV dans 20 ans :
pour faire face au marché les entreprises devront fonctionner par projets, comme un film de cinéma : un film c'est une entreprise temporaire qui réunit pendant une durée déterminée un budget, une équipe, un projet. Quand il est terminé il est rentable ou non et les équipes deviennent des intermittents du spectacle. Dans un modèle "d'entreprise jetable" qui risque de se développer pour les raisons décrites plus haut, les employés deviendront des intermittents du travail (auto-entrepreneurs)
[...]
Finalement deviendront nous de simples processus humains avec des APIs sémantisées afin que des robots puissent faire des mashups de compétences pour créer une entreprise à un instant T afin de développer un produit P ?
L'article termine heureusement sur une note optimiste mais je me demandais récemment quelle était l'utilité d'avoir encore un CV (en ligne) car le mien commence vraiment à dater. Dans quel mesure un profil, même dynamique est-il plus pertinent qu'une recherche ? Idem pour les cartes de visite, ne finiront nous pas tous par avoir cette carte :
Bien sûr je suis le premier à vous motiver à avoir votre propre nom de domaine/identité, mais un recruteur, un client, un ami ne va-t-il pas de toute façon finir par vous googler ?
PS : une vidéo intéressante à ce sujet aussi : Sécurité ou vie privée ? Le vent tourne (aussi) du côté des stratégies individuelles
Intermittents du Web
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 16 juin 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
I've just uploaded the slides of the two Semtech tutorials I was invoved in today. They are embedded below, but you can also access them directly on slideshare. It was a busy day - actually, I'm in the same meeting room from 7:30 am ! - but really interesting and I guess (and hope) the tutorials were well recieved, with interesting feedback and questions from the audience. As said previously and during both presentations, if you have any questions, feel free to drop an e-mail or directly come to have a chat if you want to discuss some of these topics more in detail.
Jeudi et vendredi dernier a eu lieu la première édition de Symfony Live, la conférence "à la française" au sujet de Symfony, le leader des frameworks PHP5. Avec près de 200 personnes dans la salle et plus de 20 présentations sur deux jours, l'évènement a été un réel succès. J'ai animé deux sessions : une première le jeudi, au cours de laquelle j'ai présenté la conception d'un réseau social à l'aide de Symfony, puis un autre vendredi, au cours de laquelle j'ai présenté une nouvelle solution de gestion de médias pour Symfony, développée au cours des derniers mois.
La série de conférences a été l'occasion de nombreuses rencontres intéressantes. Je ne citerai pas toutes les personnes avec qui j'ai discuté, par peur d'en oublier, mais ça a été un réel plaisir d'échanger avec vous !
Ma première présentation a lancé le bal de Symfony Live. Le jeudi matin, à peine réveillé, j'ai ainsi fait le tour de l'approche du développement d'un réseau social avec Symfony :
Les slides de cette conférence sont disponibles.
Après avoir fait un rapide tour des solutions existantes, j'ai présenté vendredi un nouveau plugin, que je vais publier prochainement (lire : vers la fin mois), permettant de manipuler aisément une grande variété de types de médias.

En vrac, voici les caractéristiques de cette solution :
J'ai eu la bonne surprise de constater que ma présentation a suscité de nombreuses réactions positives. Plusieurs idées d'améliorations m'ont été soumises. Voici déjà celles qui sont envisagées :
La chose la plus importante, à mes yeux, est le nombre de réactions qu'a générées cette présentation. Le framework en lui-même est une excellente solution technique, et je pense qu'il est temps de donner plus de consistance à la communauté Symfony en créant des projets annexes, éventuellement sous la forme de groupes de travail en charge du développement de fonctionnalités plus riches. C'est une vraie demande de la communauté, qui outre l'apport de composants fonctionnels efficaces et fiables, permettrait également de promouvoir le choix de Symfony dans un cadre professionnel, face à d'autres solutions à "l'effet démo" plus percutant (et oui, même de grosses bouses techniques passent parfois le premier round des sélections alors que Symfony est recalé).
Les prochaines étapes vont donc être les suivantes :
En attendant, si vous avez une idée de nom approprié pour ce projet, n'hésitez pas à me twitter ! Et pour télécharger les slides de la conférence, les voici : Symfony pour gérer des médias !
Et, comme la demande est forte, je ne résiste pas à l'envie de conclure sur l'image révélation de cette première édition de Symfony Live :
by Xavier Lacot (xavier@lacot.org) at June 15, 2009 10:45 PM
Prenons le cas pratique du micro-blogging. Comme un irréductible gaulois j'ai résisté des mois à twitter. Ils ont eu raison de moi et j'ai cédé à un moment où tout le monde parle d'un #BigSwitch. Chacun incite ses contacts à migrer vers identi.ca, et éventuellement on publie sur les deux plateformes pendant un moment.
Note : ce billet a été rédigé par Éric Daspet.
Vous avez certainement déjà connu ça quand une connaissance est passé de hotmail à gmail. Il faut prévenir tous ses contacts afin qu'ils mettent à jour les coordonnées. Trop souvent un message part à l'ancienne adresse ou un contact n'a pas fait attention à la migration. Il y a des pertes, et à terme il y aura une coupure entre les anciens restés sur twitter et les nouveaux passés sur identi.ca.
Du coup j'ai regardé identi.ca. Il y a du mieux fonctionnellement mais le grand argument c'est l'ouverture, appelée à permettre plus d'innovation et d'interopérabilité. Pour assurer cette ouverture et cette innovation, la plate-forme est décentralisée : Chacun peut monter son propre serveur laconi.ca (nom du logiciel lui-même) et se connecter avec les autres, qu'ils soient sur le même serveur sur identi.ca, ou sur le leur.
Vous avez à peu près le contrôle sur vos données, vous pouvez faire évoluer la plate-forme, mais est-ce vraiment suffisant ?
Sauf que je suis pénible, et que les migrants ne semblent pas apprendre de leurs erreurs : ils créent majoritairement un compte sur le serveur "officiel" d'identi.ca. Que ce passera-t-il quand ce serveur ne sera plus innovant ? quand il ajoutera de la publicité dans les messages ? quand il s'arrêtera par faute de sous ? ou simplement qu'il proposera des évolutions peu appréciées ?
Il y aura un second big switch. Tous ces gens vont changer de serveur, trouver un nouvel identifiant, demander à tous leurs contacts de se connecter à nouveau (et dans le pire des cas arrêter de suivre ceux qui sont sur l'ancien serveur, scindant la communauté). C'est déjà pénible de le faire une fois, de voir chaque contact pendant un mois te demander de changer l'adresse à suivre, mais si c'est pour recommencer tous les ans, là, non !
Rien ne permet d'imaginer que ce qui arrive aujourd'hui à twitter n'arrivera pas demain à identi.ca, rien. Ou plutôt tout permet de penser que ça risque d'arriver de nouveau. Personne de votre entourage n'a changé d'adresse email deux fois ? peut être même en moins de deux ans. Nous y voilà. Si c'est pour se lier à un autre prestataire, nous sommes condamnés à recommencer.
La décentralisation n'est utile que si on s'en sert, et vous ne vous en servez pas camarades. Pour bénéficier de la décentralisation il faut contrôler son serveur. Cela implique d'avoir un serveur connecté 24/24, d'y installer et configurer le logiciel, et d'opérer la maintenance régulière. Là vous contrôlerez votre identifiant et serez à l'abri de l'enfermement d'un prestataire.
Entendons nous bien, il existe des serveurs laconi.ca gratuits, plus qu'ils n'en faut, mais cela ne résoudra rien. En fait ça peut même être pire car au lieu d'avoir un big switch une fois que identi.ca dérape, on aura plein de bascules en permanence à chaque fois que c'est un serveur mineur qui tombe ou qui fait quelque chose de mal.
Certains auront leur propre serveur, comme je le fais moi pour mon blog par exemple, mais ils seront rares et on ne peut guère demander à tous de jouer l'informaticien. Même pour ces derniers c'est pénible et chronophage.
Avec la décentralisation ce qui est important c'est le contrôle de l'identifiant. Un identifiant doit être pérenne, et passer d'un serveur à l'autre sans avoir à changer. Cela veut dire que si demain je change de prestataire pour mon micro-blogging, les gens pourront continuer à me suivre, de façon presque transparente.
Le système laconi.ca ne permet pas d'identifiant pérenne indépendant du serveur. Voilà la faille.
Une solution serait que l'identifiant pérenne soit le nom de domaine sur lequel tourne votre serveur laconi.ca. Vous achetez et contrôlez votre nom de domaine pour une somme modique (5 à 15 euros par an) et vous pourrez le faire pointer vers le prestataire que vous souhaitez. C'est déjà ainsi que je procède pour mes pages web, mon adresse mail, mon identifiant de messagerie instantanée, etc. Concernant laconi.ca il suffirait d'un changement léger dans le code du logiciel pour qu'il sache quel domaine utiliser suivant comment on y accède, compatibilité totale avec l'existant non modifié.
C'est la voie royale, qui vous permet de garder toujours contrôle de votre identité, quel que soit le média. Plus que le contrôle de mes données passées, c'est le contrôle de mon identité elle-même que je sauvegarde. Pour une dizaine d'euros par an (le prix d'un nom de domaine), ce n'est vraiment pas cher payé.
L'indirection est la voie du pauvre, mais c'est aussi celle qui pourra toucher le plus grand monde. C'est par exemple ce qu'utilise la délégation OpenID.
Pour joindre le serveur OpenID d'un correspondant, je regarde son identifiant et je vais chercher la page web associée. Là je regarde s'il y est indiqué quel prestataire OpenID je dois utiliser pour cet identifiant. Pour changer de prestataire mon correspondant n'a qu'à mettre à jour sa page web.
Pour laconi.ca il suffirait d'aller regarder la page de profil de mon correspondant, repérer l'adresse de la page personnelle, et y récupérer l'adresse du prestataire de micro-blogging. Si identi.ca ne me convient plus, je peux modifier ma page personnelle. Le serveur de micro-blogging de mes correspondant lira mon ancien profil identi.ca, ira trouver ma page personnelle et y verra mon nouveau serveur. Tout peut être mis à jour en toute transparence sans avoir à avertir tout le monde et à risquer des coupures. Cette vérification peu facilement être réalisée une à deux fois par semaine sans pénaliser les performances.
On ne résout pas tout. En particulier seul le contrôle d'un nom de domaine propre me permettrait de palier un arrêt total d'identi.ca, mais on éviterait exactement ce qu'il se passe actuellement lors de la migration de twitter vers identi.ca.
Il reste à définir comment déclarer le serveur de micro-blogging dans ma page web, et c'est là que je fais appel aux informaticiens. Par quel système est-il préférable de faire la déclaration ? une balise <meta> ? un fichier XRDS ? un fichier FOAF ? (et si oui quelles balises)
L'expérience OpenID m'incite à penser qu'une balise <meta> ou <link> est ce qu'il y a de plus simple mais un fichier FOAF reste très tentant. On peut envisager les deux, mais il faut décider des balises et du mécanisme exacte de découverte. Quid ? j'attends vos commentaires et vos propositions.
Ouvert et décentralisé, est-ce suffisant ?
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 15 juin 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
by David Larlet at June 15, 2009 01:52 PM under WebSemantique
Éric me fait l'honneur de venir publier ses articles qui ne sont pas relatifs aux performances web sur ce site. Le temps que j'adapte le moteur pour qu'il accepte plus d'un auteur, vous repèrerez ses articles grâce au chapô d'introduction.
J'espère que ça me motivera pour publier plus souvent aussi :-).
Éric Daspet publie (aussi) sur biologeek
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 15 juin 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
by martinlessard at June 15, 2009 10:08 AM under WebSemantique
Merci Laurent pour m’avoir amené à relire le contenu de l’appel à projet du gouvernement. J’ai été comment dire… surpris. 681 mots et 3 fois la mention “web sémantique”, un lien vers un dossier complet sur le sujet (11/08), et même un bout de RDFa. Mais bon, faut quand même pas déconner, dans les inpacts sociétaux, le dossier met en avant les risques de dérives liés au respect de la vie privée, la capacité de traitement [...] aux mains de quelques acteurs privés non-français [...] pose un problème de souveraineté nationale, et enfin, le Web est encore un media nouveau. Bref le web sémantique c’est bien, mais bon ca fait un peu peur quand même
Bah ouai c’est nouveau et en plus les américains ils ont pleins d’ordinateurs qui nous observe. Donc molo, molo…
Mais voila, il faut croire que les doutes sont loins, que depuis octobre les choses ont changés, et que l’amie NKM veut financer du tripplet. Voila ce qu’on peut lire dans l’introduction de l’appel à projet:
En parallèle au Web social, les prochaines grandes évolutions des services du Web, notamment le Web sémantique (recherche de contenu vidéo par exemple) et le Web temps-réel (microblogging par exemple), se dessinent et les entreprises du Web, aussi bien acteurs actuels que nouveaux entrants, commencent à se saisir des enjeux importants de ces évolutions.
Alors? Champion du monde? Je ne crois pas… Il me semble que le gouvernement français se limite à une action du type: “le web sémantique: oui, mais pas avec nos données”. @nk_m Subvensioner la recherche c’est bien, mais ce qu’il manque aujourd’hui au web sémantique, ce sont des données. Nous voulons bien créer des moteurs de recherche de nouvelle génération, nous voulons bien faire ressortir toute la richesse du web, mais pour cela la communauté du web sémantique n’a pas seulement besoin d’argent, mais aussi (surtout?) de vos données !! Des données de votre gouvernement, auxquelles nous revendiquons l’accès en tant que citoyen (cf. l’appel de Tim berners Lee).
I just arrived in San Jose for SemTech as I will speak in two tutorials tomorrow (i.e. the 15th of June - oh btw, I'll be 29 that day :-) :
That said, that's my first time in SemTech and I should be in the conference venue for the whole event in addition of these two tutorials. If you want to discuss some of these topics or anything related to the Semantic Web - or just say hello - , feel free to ping me here and I'll be happy to have a chat. In addition, I'll also attend the upcoming VoCamp Sunnyvale in Yahoo on thursday afternoon and friday, that sounds also really exsiting, and then will finally take some holidays in San Francisco ... unplugged.
Faisons un instant l’hypothèse que le web n’existe pas et nous comprendrons immédiatement que le moteur et le support d’une transformation vers une économie de la contribution manque. Cette hypothèse, nous le savons, beaucoup sont tentés de la faire.
J’aimerais donc souligner trois points préliminaires (qui sont des impératifs, des conditions nécessaires) en rapport au texte « Dataware et infrastructure du cloud computing» paru dans Pour en finir avec la mécroissance, avant d’avancer deux propositions pour que la puissance publique puisse jouer son rôle dans la mise en oeuvre d’une économie de la contribution.
Voici donc les trois points :
1. Défendre le droit d’accès à internet en rappelant si nécessaire, comme l’a fait l’Europe et, cette semaine, le conseil constitutionnel en France, que l’accès à internet relève d’un droit fondamental. C’est à dire que couper la connexion internet n’est en aucune manière une solution aux troubles dont il serait responsable.
Il est à ce propos étonnant de constater, alors que Bernard Stiegler parle, dans la Mécroissance, du passage du temps Carbone au temps Lumière, toutes ces métaphores qui fleurissent pour nous expliquer comment doit fonctionner le web à partir du modèle de l’automobile : permis à points, limitation de vitesse, radars automatique, etc. Révélant par là même les limites d’une certaine conception de l’économique politique.
2. Veiller à la neutralité du net, s’assurer qu’internet reste un service public universel et ne se morcelle pas en autant de services qu’il y aurait de fournisseurs d’accès.
3. S’assurer que le net, qui provoque une crise des modèles dissociés ainsi qu’un désajustement, ne soit pas réajusté exclusivement à partir de l’outil de production des géants du web. Mais, cela dit, je m’empresse de préciser immédiatement que les géants du web sont nécessaires car ils sont actuellement le premier rempart contre ceux qui veulent remettre en cause la neutralité du net : Google est le premier défenseur de poids du principe de neutralité du net.
Cela posé, comment faire que la puissance publique ait une politique du web dans le cadre d’une économie de la contribution. Une politique qui ne se résume pas à une utilisation du web comme outil de communication, un simple media de plus (un nouveau canal, comme on parle de stratégie multi-canal dans les banques et assurances). Cette politique du web repose sur deux initiatives nécessaires :
Dans ce contexte, nous somme de plus en plus nombreux à penser que la condition de possibilité qu’une économie de la contribution passe par la mise en oeuvre d’une allocation universelle (ou revenu d’existence), dont les mécanismes et les montants d’attribution doivent être indexés sur la prise en compte des externalités produites par des activités qui relèvent notamment des techniques de soi et de la sphère de l’otium. Ce qui est une manière de revaloriser le travail face à l’hégémonie de l’emploi. Tout le monde peut travailler même si tout le monde n’a pas un emploi : il faut en effet refuser le syllogisme qui voudrait que celui qui n’a pas d’emploi ne travaille pas.
Sur cette question du revenu d’existence, il y a un risque élevé que le débat reste idéologique tant que les infrastructures, les technologies et les politiques d’ouverture des données (dataware) ne soient là pour mesurer et outiller les opportunités qu’il promet.
Dans nos gouvernements occidentaux, trop de politiques sont conduites dans le cadre d’une occultation et d’une manipulation des données ( économiques, sécuritaires, agricoles, environnementales, santé, sociales, etc.). Je parle des gouvernements, mais cela est aussi de plus en plus vrai au niveau territorial ne serait-ce qu’en vertu des démarches de décentralisation.
Enfin, à la question de l’économie créative par rapport à l’économie de la contribution je serais tenté de dire aux régions et aux territoires, avec qui Ars Industrialis a commencé à travailler : initiez rapidement vos démarches d’ouverture des données et investissez dans un centre de données pour opérer la révolution contributive qui seule pourra porter une économie de la contribution. Dit autrement, je crois que la création est une conséquence de la contribution, et qu’en la matière il y a un ordre et une logique des choses à respecter si l’on ne tient pas a dévaloriser précisément ce que l’on attend de l’économie créative.

I'm happy to announce CommonTag, a new RDFS vocabulary for Semantic Tagging, designed to bridge the gap between free-text tagging and Linked Data. In a similar way that what I've done in the past with MOAT, CommonTag allows one to create links between his tags (as simple keywords) and the concept they represent, defined as URIs of Semantic Web resources, from public knowledge bases such as Freebase or DBpedia.
What is especially relevant with regards to CommonTag is that the vocabulary aims to be simple to understand, easily accessible, and with an easy RDFa annotation process for end-users and Web developers. On the other hand, it features mappings with existing tagging vocabularies (the Tag Ontology, MOAT, SCOT, SIOC and SKOS) for those who want to go further or use their existing applications with this new model.
But most interestingly, as one can see when browsing the website, a key feature is that CommonTag is not an isolated initiative but supported by various companies involved in the Semantic Web and the Social Web -- and especially in both ! -- namely (for the initial nucleus and by alphabetical order, hope it will grow soon !) AdaptiveBlue, DERI (NUI Galway), Faviki, Freebase, Yahoo, Zemanta and ZigTag - and I must add that was a great experience to design this vocabulary together !
CommonTag is already supported in various applications as you can see on the website and on the following picture, from Zemanta to index your blog posts to Sindice to build applications on the top of it. And there is more to come soon, stay tuned ;-)


Encore répété mardi à geek chic et hier soir à mes amis de creads, pearltrees ça poutre. Après avoir fixé un bug sur pearl an URL ce matin, vous êtes maintenant capable de créer des cartes dans spotify. “The URL is the new MP3” peut on lire en bas de page sur leur site… Concept intéressant
Voici une toute première carte qui va très vite s’agrandir: mon univers musical.
Petit tips de déplacement dans le player: j’ai mis pas mal de branches alors si la musique vous plait moins: retour en arrière et plongeons dans une nouvelle branche
Ceci dit il y a encore des améliorations à faire à la fois côté pearltrees et côté spotify:
note: pearltrees est en alpha et spotify en beta privé. D’ailleurs il me reste des invites pour spotify…
ARS INDUSTRIALIS, QUATRE ANS APRES
Débats au Théâtre National de La Colline
samedi 13 juin 2009
14 rue Malte Brun – Paris 20° – métro Gambetta
14 heures
Entrée libre
J'ai tant rêvé de toi que tu perds ta réalité.
Est-il encore temps d'atteindre ce corps vivant
Et de baiser sur cette bouche la naissance
De la voix qui m'est chère?J'ai tant rêvé de toi que mes bras habitués
En étreignant ton ombre
A se croiser sur ma poitrine ne se plieraient pas
Au contour de ton corps, peut-être.
Et que, devant l'apparence réelle de ce qui me hante
Et me gouverne depuis des jours et des années,
Je deviendrais une ombre sans doute.
O balances sentimentales.J'ai tant rêvé de toi qu'il n'est plus temps
Sans doute que je m'éveille.
Je dors debout, le corps exposé
A toutes les apparences de la vie
Et de l'amour et toi, la seule
qui compte aujourd'hui pour moi,
Je pourrais moins toucher ton front
Et tes lèvres que les premières lèvres
et le premier front venu.J'ai tant rêvé de toi, tant marché, parlé,
Couché avec ton fantôme
Qu'il ne me reste plus peut-être,
Et pourtant, qu'a être fantôme
Parmi les fantômes et plus ombre
Cent fois que l'ombre qui se promène
Et se promènera allègrement
Sur le cadran solaire de ta vie.Desnos, Robert. , J'ai tant rêvé de toi, Corps et Bien. Gallimard 1930. p. 113.
Michael Lynton, patron de Sony Pictures Entertainment, a eu sa petite heure de gloire il y a quelques semaines. Vous en avez sûrement entendu parler, c’est en effet celui qui a déclaré :
« Je suis un gars qui n’a rien vu de bon sortir de l’internet»
Assurément, cette déclaration est à ranger parmi les déclaration de dirigeants qui, a force de prendre la parole à droite et à gauche, finissent par dire des vérités et à faire tomber les masques : souvenons-nous de la déclaration de Patrick LeLay de TF1 nous rappelant la vérité sur son business à propos du « temps de cerveau disponible» .
Que reproche donc Michael Lynton à l’internet ? Pour nous l’expliquer, il doit faire appel à des métaphores. On commence à avoir l’habitude. En effet, il n’est pas une industrie de rente qui nous rappelle aux bonnes vieilles pratiques dans la « vraie vie» , et des règles qui la régissent, pour nous faire comprendre à quel point le web est « nuisible» . Le reproche, et la métaphore qui va avec, sont donc les suivants :
« L’internet a créé cette idée que chacun peut avoir ce qu’il veut, quand il veut. [la métaphore arrive pour que l'on comprenne bien] C’est comme si les magasins de Madison Avenue étaient ouverts 24 heures par jour. Ils [qui est ce "ils" ?] se sentent autorisés et disent « donnez le moi maintenant !» , et si vous ne le leur donnez pas gratuitement, ils le volent.»
Étonnant de voir comment une industrie qui matraque les consommateurs pour provoquer des comportements pulsionnels d’achat en vient à se plaindre en constatant ces mêmes comportements pulsionnels vis à vis de ses produits.
» Mais ce sont des sauvages !» , pourrait dire Michael Lynton. A quoi je lui répondrai : « Non, ce sont TES sauvages» .
Filant toujours la métaphore des transports, chère à nos censeurs du web, Michael Lynton poursuit en disant :
« C’est comme si l’on construisait des autoroutes sans limitations de vitesses ou sans permis de conduire : nous avons besoin de règle sur la route.»
Décidément, plus le capitalisme de l’automobile est en crise, plus on va nous le resservir en modèle pour nous expliquer comment on doit utiliser internet.
Ce soir, mardi 9 juin, toute l’équipe de pearltrees vous donne rendez-vous au Brazil Tropical 34, rue du départ 75015 à Paris pour la 4ème soirée geek chic. Nous vous attendons dans un spacieux et joli stand pour vous présenter pearltrees en direct, répondre à vos questions, faire des démos ou simplement de discuter geekement autour d’une pinte.
La difficulté majeure de travailler en agences Web est de se « battre » contre les mythes. Ils sont nombreux et variés. Quelques exemples :
Il y a souvent au moins deux paramètres dans ce mythe. Les sites « événementiels » (traduire ici poubelle). Une certaine forme d'éjaculation précoce de la conception Web. Plus vite, plus beau, plus court et… très peu satisfaisant.
Un site Web utile ne peut pas être beau. Le flash peut être utile dans certains cas précis de visualisation et d'animation (artistique et pratique). Canvas/SVG commence à montrer le bout de son nez, mais manque toujours de la plateforme de développement dont bénéficie Flash (malheureusement).
Use the right tool for the job.» Dans la conclusion de l'article, nous recommandions d'être prêt pour XHTML 2.0, malheureusement les navigateurs Web en ont décidé autrement. Le reste de l'article est toujours valide.
Bien sûr la liste est plus longue, je les collecte petit à petit. Le plus étonnant pour moi, peut-être est que je retrouve exactement les même types de mythes que ceux du début des CSS. Les tableaux étaient roi, Netscape était le navigateur supporté et les CSS étaient irréalistes ; les proposer tenait de l'idéaliste en dehors des réalités du business. (Mettre ici le sourire en coin sur mon visage). La route est longue. Il faut composer avec les contraintes individuelles, faire preuve de patience et tenter d'accompagner les gens sur la voie du changement.
Home est un très bon film: important et beau. Et comme pour “an inconvenient truth“, il est important de sensibiliser notre entourage grâce à ces oeuvres. C’est alors dommage de voir qu’on limite la diffusion du film Home: embed youtube interdit, copyrights, tout est mis en place pour freiner la viralité de ce film magnifique. On peut lire sur Owni:
Lors de l’avant première, le 3 juin dernier à Paris, Yann Arthus Bertrand déclarait enthousiaste : “il n’y a pas de droits, n’y a pas de copyright, montrez-le au maximum de gens”. Un enthousiasme qui confine ici à la naïveté. Le film est bel et bien protégé par un copyright, et la société de Luc Besson, EuropaCorp, a bel et bien l’intention d’en contrôler l’usage, et de toute évidence, d’en tirer un profit, d’une façon ou d’une autre. Si l’intention de l’auteur était de diffuser son message au plus grand nombre, c’est un semi-échec, en pactisant avec le Diable, le film de Yann Arthus Bertrand pourrait y perdre son âme, et ce serait une catastrophe.


Comme je le disais le film est bon et il est logique que le stream haute définition se soit retrouvé si vite partagé. Le film est dans la nature! C’est ce qu’on peut dire quand 8000 personnes téléchargent au même moment. Mais n’est ce pas ce qu’aurait voulu l’auteur ?
Alors parlez en autour de vous. Allez au cinéma. Regardez le sur youtube. Télécharger le sur mininova. Mais s’il vous plait, regardez le !
J’ai été invité par l’éditeur CA (il paraît qu’il ne faut plus dire « Computer Associates» ) qui, avec le CA Expo09, organisait le 4 juin dernier une journée sur les thèmes de l’innovation et du Lean IT.
Lors de la conférence d’ouverture du matin, en présence de Nathalie Kosciusko-Morizet, Yves Coppens avait commencé par raconter l’anecdote du crapaud fou :
Les crapauds fous ce sont ces batraciens qui, en suivant une direction différente du reste du groupe lors des périodes de reproduction, risquent une fin certaine. Mais ce sont ces mêmes crapauds qui, allant dans une mauvaise direction, explorent de nouveaux territoires, assurant parfois la survie de l’espèce lorsqu’une autoroute coupe soudain les itinéraires menant aux lieux de reproduction des crapauds normaux.
Ensuite, juste après la table ronde à laquelle je participais en début d’après midi, Yves Coppens, encore lui, a fait une allocution sur « L’Innovation au service de l’humanité » où il a retracé les origines de la vie sur terre. Durant son discours, il a beaucoup utilisé l’expression « innovation de la vie» ou encore « innovation du vivant» .
Entre le « crapaud fou» du matin et » l’innovation du vivant» l’après midi, je crois qu’il y a eu beaucoup de contre-vérités relatives à l’innovation. A mon sens, il s’agit d’un anachronisme : on ne peut pas parler d’invention ou même d’innovation du vivant, si ce n’est bien sûr de manière métaphorique. Car innovation et invention sont relatifs à la technique, et il n’y a pas de technique dans l’évolution d’une cellule ou dans l’histoire du « crapaud fou» .
*
Mais peut-être faudrait-il commencer par rappeler la distinction entre invention et innovation. C’est donc fort à propos que Telerama publie une interview de Stiegler à propos de l’innovation dans laquelle ce dernier rappelle que :
« Il n’y a pas d’innovation sans invention, mais il existe beaucoup d’inventions qui ne produisent aucune innovation. L’innovation consiste à socialiser des inventions technologiques, elles-mêmes issues de découvertes scientifiques. Innover, c’est produire du nouveau (méthodes, objets, services) pour l’installer sur un marché. Et la guerre économique se livre sur ce terrain de l’innovation. France Télécom a largement contribué à établir la norme GSM (en téléphonie mobile), mais c’est Nokia qui l’a socialisée, donc qui a été innovante. Le Cnet (Centre national d’études des télécommunications), ancêtre d’Orange Labs, était un des meilleurs laboratoires de recherche au monde. Mais en France, où il y a d’excellents chercheurs, le management ne sait pas valoriser la recherche – le nez collé sur le court terme, il accuse d’autant plus les chercheurs de conservatisme qu’il manque de vision de l’avenir et refuse de prendre des risques.»
L’innovation est un sujet éminemment transverse et interdisciplinaire. Sont convoqués : les sciences, les technologies, l’industrie, la psychologie, l’économique et le social. Et, que ce soit pour de bonne ou de mauvaises raisons, je pense que tout le monde s’accordera à dire que l’innovation est le moteur de l’économie du capitalisme industriel, ce qui explique au passage la gloire posthume grandissante de Joseph Schumpeter�.
Mais si l’innovation est le moteur de l’économie, que se passerait-il si elle venait à ne plus pouvoir s’exprimer ? C’est en effet ce qui menace le système des brevets sur lequel repose les industries de l’innovation, et à propos duquel j’aimerais attirer votre attention.
Le système des brevets permet de déposer de manière légale une invention afin de se protéger pendant la phase d’innovation pour avoir le temps de socialiser le nouveau produit sur le marché, et de récupérer le fruit des investissements consentis en amont. Mais tout çà, c’est de la théorie, dans la pratique, et ce depuis les années 90, le système des brevets, les fameux « patents» , a du plomb dans l’aile.
Si déposer un brevet était un moyen pour se protéger, c’est devenu une finalité en ce sens que s’est développée une activité de gestion et d’acquisition de brevets sans aucun objectif d’innovation à la clef. Cette activité a un nom qui a été popularisé sous le terme de Patent Troll. Le principe est le suivant : il s’agit d’acquerir des brevets non pas pour développer des innovations mais pour faire payer ceux qui utiliseraient les inventions brevetées. Les principales cibles sont les grands groupes industriels des technologies qui ont les moyens financiers et industriels d’innover : Microsoft, Apple, Intel, etc.
En réaction à cette menace, l’activité de dépôt de brevet a connu une croissance exponentielle chez ces grands industriels. Ainsi Microsoft a atteint cette année le chiffre aberrant de 10 000 brevets déposés, dont la moitié ont été déposé durant les deux dernières années. Cette activité à part entière est assurée chez Microsoft par un département d’une centaine de personnes comprenant une quarantaine d’avocats spécialisés.
Autres noms donnés à ces « Patent Trolls» : non-practicing entity (NPE), non-manufacturing patentee, patent marketer, ou patent dealer dont le tableau ci-dessous en recense les principaux avec le nombre de brevets à leur actif et le nombre d’actions en justice qu’elles ont initiées :
Christian Harbulot, Directeur de l’École de Guerre Economique, rappelle dans un article de l’Usine Nouvelle le fonctionnement de ces entités :
« La technique consiste à identifier des compagnies innovantes qui, du fait de leur taille trop réduite, ne peuvent assurer une protection adéquate de leurs inventions. Si elles acquièrent bien des brevets pour protéger le fruit de leurs efforts en recherche et développement, le coût lié à la défense de leurs droits ou leurs valorisations s’avèrent trop important. Typiquement, elles tolèrent que de grosses compagnies commercialisent des produits très proches de leurs inventions plutôt que de les assigner en justice du fait des coûts exorbitants pour obtenir gain de cause.
Les NPEs rachètent ces brevets à une valeur bien supérieure à leur valeur reconnue, et menacent les grandes compagnies telles Microsoft, Sony, HP… de les poursuivre devant les autorités judiciaires pour copie de modèles protégés et infraction à la réglementation sur la propriété intellectuelle. Il faut croire que la menace fonctionne puisque Intellectual Ventures arriverait régulièrement à obtenir des compromis, les majors lui signant des chèques de 200 millions à 400 millions de dollars en échange de sa renonciation à entamer procédure judiciaire sur procédures.»
Censés assurer la continuité entre l’invention et l’innovation, le système des brevets n’assure plus aujourd’hui les nobles intentions de Thomas Jefferson :
« The true value of an invention is its usefulness to the public.»
Le système est court-circuité par une activité spéculative qui se développe à l’image de ce qu’on connaît dans la finance. C’est d’ailleurs ce parallèle qu’a récemment fait Andrew Grove, ancien responsable d’Intel, en évoquant un phénomène similaire à celui de la titrisation :
« La vraie valeur d’une invention est de son utilité pour le public. Le système en place dans la Silicon Valley est aujourd’hui de s’éloigner de plus en plus loin de ce principe. Les brevets sont devenus eux-mêmes des produits. Ils sont des instruments de placement négociables sur un marché distinct, souvent motivés par des spéculateurs financiers cherchant le meilleur retour sur leurs investissements» .
Qu’on ne s’y trompe pas pour autant : ceux qui dénoncent les dérives du système des brevets sont ceux qui, comme je l’ai rappelé, ont la force de frappe pour industrialiser et promouvoir les inventions. Intel a la puissance financière et les outils de production pour innover dans les semi-conducteurs, et ce de manière quasi hégémonique. Leur prendre quelques centaines de millions de dollars parce qu’ils violent des brevets c’est aussi une manière de leur rappeler qu’ils jouent de l’innovation pour leur propre intérêt et non pour celui du public auquel en appelle avec un certain cynisme Andrew Grove.
Pour ces groupes industriels, l’innovation reste une menace vis à vis des rentes de situations qu’ils ont acquis, parfois en constituant des quasi-monopoles de fait.
Voici donc un autre chantier d’importance pour la mise en oeuvre d’une économie de la contribution, avec des solutions qui doivent renvoyer dos-à-dos aussi bien les grands industriels monopolistiques des technologies de l’esprit que les prédateurs des « Patent Troll» qui veulent faire du brevet un produit de spéculation.
Que c’était beau Home.
Une beauté glacée, distanciée, abstraite.
Jusqu’à ce que je ressente un malaise.
Quand la caméra flotte, le regard aussi et j’ai commencé à divaguer.
J’ai essayé de me raccrocher au commentaire, mais lui aussi était à la dérive.
Ce commentaire m’a fait penser à ces descriptions que l’on fait d’une tâche d’encre où l’on dit ce que l’on imagine y voir.
J’ai beaucoup pensé au film « Soleil Vert» où l’on diffuse exactement ce genre d’image à ceux qui vont mourrir avant d’être recyclés en nourriture.
C’est peut-être çà le malaise : celui d’avoir vu un film de condamné.
L’événement provoqué par la diffusion du documentaire, libre de droits, et les discussions qui vont s’en suivre sont finalement beaucoup plus intéressants que le documentaire lui-même.
Après avoir lu un peu tout et n'importe quoi à son sujet, de « Wave va tuer HTTP » à « Wave est le remplaçant de Twitter, de Facebook, du mail, etc etc ». Restons sérieux un instant en se concentrant sur ce qu'est Google Wave : un protocole, une plate-forme et un produit.
Bon on commence par ce qui a fait sourire tous les geeks en lisant la spec :
The Google Wave Federation Protocol is an open extension to XMPP core [RFC3920] protocol to allow near real-time communication between two wave servers.
C'est Open-Source et vous pouvez installer votre serveur Wave chez vous. Par contre ça conserve une architecture provider/consumer et il n'y a pas de possibilités de faire du peer-to-peer - ou plutôt wave-to-wave - et le provider initial garde le contrôle sur la wave (je détaille un peu ces parties techniques car ça aura son importance sur la suite) :
The operational transform used for concurrency control in wave is [currently] based on mutation of a shared object owned by a central master. As a result, in order to achieve federation while still respecting the concurrency control protocol, only one server may 'own', or be 'authoritative' for a given wave (and its operations), regardless of whether the participants use different service providers.
Et oui il ne faut pas se laisser avoir par les community principles :
Wave is a distributed network model: traffic is routed peer-to-peer, not through a central server
Qui parlent bien de trafic, chaque mot a son importance dans le marketing. C'est un beau pied de nez à la folie du Cloud de la part de Google : qu'importe le support, la donnée restera à nous !
En conclusion sur le protocole, rien de bien extraordinaire, si ce n'est que l'on en arrive à une position de Embrace, extend and extinguish qui a fait le monopole de Microsoft pendant de trop longues années...
Ça c'est ce qu'on voit sur toutes les captures et videos Google, et effectivement ils ont compris avec Facebook que la construction d'une plate-forme suffisait pour conserver le contrôle sur les données. Pas besoin de s'embêter à faire trop d'applications (la suite Google suffira), des développeurs payés des cacahuètes vont s'en charger pour eux :-).
Pas grand chose à redire là-dessus, si ce n'est que Google va tout faire pour que vous initiez vos waves chez eux, forcément (cf plus haut). Au passage, vous allez sûrement apprendre GWT, ce qui renforcera la force développante Google.
Et c'est là où ça devient intéressant. Toute la présentation est basée sur la plate-forme car parler d'un protocole est chiant à mourir et mettre en avant un produit Google peut faire peur. Mais c'est pourtant la finalité de Google Wave : transformer Chrome en un notificateur unique, un Wave browser qui lui procurerait un avantage difficilement rattrapable par la concurrence. Le produit sera bien sûr compatible avec les autres navigateurs mais optimisé pour Chrome (comme le sont les Google Apps). Je me demande d'ailleurs dans quelle mesure le produit pourra tourner sur App Engine.
Pour conclure, on a pu assister à la sortie d'un produit Google déguisé sous une plate-forme (pour faire plaisir aux commerciaux qui vont pouvoir vendre de la wave jusqu'à plus soif) et un protocole (ouvert, pour faire plaisir aux geeks), mais dans l'usage il y aura 95% de waves Google, soyons réalistes (et optimistes, sinon j'aurais mis 99%). Ça n'en reste pas moins un excellent produit basé sur un protocole qui a fait ses preuves, en rajoutant une couche de marketing à la Google, ça ne peut que marcher !
Là où je suis surpris c'est qu'ils aient choisi de garder un historique des waves alors qu'à l'ère du flux j'aurais plutôt eu tendance à privilégier l'instantanéité face au versionnement. Après il y a probablement un cap psychologique que l'on est pas encore prêts à franchir à ce niveau aussi (surtout pour les entreprises !). Mais ça viendra ;-).
Quoi qu'il en soit, le real-time tant attendu ne va pas nous aider à avoir des réflexions plus poussées, pas très réjouissant ça (dit-il en écrivant devant Roland Garros...).
Google Wave, une fois la vague de buzz retombée
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 05 juin 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
Workshop homepage and CFP coming soon !

Il en serait toujours ainsi. Toujours. Pour la première fois ce vieux lutteur s'étonnait de se sentir las. L'arrivée des avions ne serait jamais cette victoire qui termine une guerre, et ouvre une ère de paix bienheureuse. Il n'y aurait jamais, pour lui, qu'un pas de fait précédant mille pas semblables.
de Saint-Exupéry, Antoine. Vol de nuit. Gallimard 1931. p. 28.
Lire des textes qui portent encore la brûlure du rabot, l'incision du ciseau donne le cœur à l'ouvrage. Le verbe humain bombe le torse et pose un pas ferme sur le sol. De la nuit recroquevillée, je sors à la lecture de Vol de nuit, homme, volontaire, sur un chemin de terre, les sillons du cuir affirmés. Soudainement se sentir partie du corps des humains et avoir toute l'humanité qui nous élève à bout de bras vers le futur.
Dans le texte se révèle le quotidien ; dans la fiction, le réel.
–C'est le règlement.
« Le règlement , pensait Rivière, est semblable aux rites d'une religion qui semblent absurdes mais façonnent les hommes. » Il était indifférent à Rivière de paraître juste ou injuste. Peut-être ces mots-là n'avaient-ils même pas de sens pour lui.
de Saint-Exupéry, Antoine. Vol de nuit. Gallimard 1931. p. 46.
Les hommes sont nés d'enfants devenus adultes. Le refuge de l'autorité pour éviter de penser, pour ne pas avoir à choisir. Ils ont dit « Il faut imposer. » J'ai pensé « De quoi ont-ils peur ? » La peur d'accéder à la liberté, l'autonomie, le besoin de soumission de ces hommes enfants.
Il devinait pourtant la puissance ramassée dans l'immobilité de cette ombre, et il l'aimait.
de Saint-Exupéry, Antoine. Vol de nuit. Gallimard 1931. p. 71.
Chaque jour est un élément de surprise. Dans mon activité professionnelle, la dynamique socio-géographique a changé. Le W3C est une équipe de 60 personnes totalement distribuée à travers le monde. Il est très important de pouvoir communiquer l'information asynchrone. Cette contrainte change de nombreuses choses. Si j'ajoute à ceci quelques autres éléments, j'obtiens une dynamique de travail plus clair. En ce moment, mon travail consiste beaucoup plus à réorganiser, à sculpter l'échange d'informations qu'à une expertise Web.
Utiliser le Web comme un outil de travail permet de comprendre ce que l'on peut faire avec le Web. Peu d'agences Web aujourd'hui font du Web. Beaucoup font de la représentation d'information sur le Web. Changer cette dynamique exige de changer la culture de travail même des agences Web et de leurs clients.
Premier enjeu : par exemple, plus aucun échange de documents word.
Ouai, je sais, sur ce coup là je suis un peu à la masse :). Vous utilisez quoi comme commandes ubiquity ? Pour l’instant j’utilise la commande twitter (celle par défaut), twittersearch (comme son nom l’indique), translate (bien pratique en ce moment), et la commande spoton qui permet d’effectuer une recherche dans spotify. Pour l’instant j’ai fait mes courses dans cette très belle liste de commandes. Ca serait pas mal de créer la commande pearl, des gens intéressés ?
Entrouvrir la brèche dans l'épaisseur. Glisser un œil dans l'entrebâillement. S'enivrer de l'éphémère aube. Voilà ce qui m'élance dans le mouvement. Une forêt de mousse au printemps, des bouleaux qui s'épellent d'écorces, une course dans la brume ensoleillée. Voilà ce qui m'éclôt.
Pour être créatif, pour imaginer de nouveaux horizons, il faut voir, ressentir et comprendre. David Ascher propose de Rendre visible les données sur la page de démarrage de Thunderbird afin de mieux comprendre votre courrier électronique. Il utilise la bibliothèque javascript-SVG de visualisation Protovis.
Parfois l'interface d'accès à nos données se résume à la minimisation des interactions sans pour négliger la multiplicité des modes d'accès. Le W3C m'a appris qu'il était important de pouvoir interagir avec ses outils divers. Par exemple, tracker, le logiciel de suivi des tâches est accessible par Web, par mail, et par IRC de manière transparente.
Comprendre que les modes d'action avec l'environnement urbain sont sujets à la gravitation. Les utilisateurs de bixi, vélo communautaire de Montréal, ne veulent pas remonter les côtes. L'espace géographique de nos déplacements s'accompagne de la narration de nos vies. Il y a des histoires de voyage qui nous construisent comme les cernes d'un arbre.
Voir aide à se voir. S'émouvoir pour révéler les sillons ocres de nos peaux, s'épanouir dans le parfum des fleurs sous la pluie.
Cet article "amazon web services pour déployer un site web : architecture et limitations" est initialement paru sur le blog de Clever Age.
Amazon a développé au cours des dernières années une série de services de cloud computing, regroupés sous l'appellation "Amazon Web Services", qui permettent de déployer rapidement des architectures extensibles, sans les désagréments de la logistique matérielle. Pour le web, les services d'Amazon répondent principalement à trois problématiques :
Premier service à avoir été lancé par Amazon, il y a trois ans, S3 est une solution de stockage de données en ligne. Une fois son compte créé, l'utilisateur peut envoyer des fichiers - appelés des "objets" dans le jargon Amazon - dans des dépôts distants (des "buckets"), en identifiant chaque fichier par une clé unique (une "key").
Comme la majorité des services proposés par Amazon, S3 est accessible par le biais d'une API REST, à laquelle s'interfacent de nombreuses applications : l'extension S3Fox pour Mozilla Firefox, CloudBerry Explorer, etc., mais également des solutions de sauvegarde automatisée comme Jungledisk, Vembu StoreGrid ou encore s3backup.... Les données étant stockées de manière redondante sur les serveurs d'Amazon, une politique de sauvegarde s'appuyant sur S3 est donc plus sûre qu'une simple copie sur CD ou DVD ré-inscriptible, même s'il convient toujours de conserver par sécurité une copie locale de ces données. Au final, S3 est donc à la fois une solution de stockage de données en ligne, de sauvegarde automatisée d'entreprise, voire même de sauvegarde de tout un site web.

S3Fox, une extension Firefox permettant de gérer les contenus présents dans S3
La facturation du service par Amazon est faite sur la base du volume de données transférées et entreposées sur les serveurs d'Amazon.
Les services offerts par Amazon vont plus loin que le simple stockage en ligne de fichiers. Avec EC2, une offre lancée en août 2006, Amazon propose une solution de virtualisation à grande échelle. EC2 permet de déployer en quelques clics des images virtuelles, nommées des AMIs sur des serveurs virtualisés hébergés par Amazon, appelés des "instances".
Amazon fournit un outil permettant de créer ses propres instances (en réalité, des installations complètes du système d'exploitation), mais propose également un annuaire d'images virtuelles comprenant plus de 300 références, vierges (Windows Server, Ubuntu Linux, CentOS, OpenSolaris, Oracle Enterprise Linux, openSUSE, Debian, Fedora, etc...) ou spécialiées (MySQL Enterprise, Oracle 11g, Ruby On Rails, Drupal, IIS/Asp.Net, LAMP, Windows Media Server, ...). Le déploiement d'une instance vierge se fait donc en quelques minutes, directement depuis l'interface web d'AWS.
En plus de cette puissance de calcul virtualisé, EC2 fournit quelques outils supplémentaires :
Dernier "gros" service fourni par Amazon, Cloudfront est un réseau de distribution de contenu. Le principe d'un CDN est simple : lorsqu'un utilisateur, situé au Japon, tente d'accéder à un contenu hébergé en France, il doit généralement faire face à une latence importante, en raison de la durée d'acheminement de ce contenu. Afin d'accélérer la "livraison" de ce contenu, Amazon propose avec Cloudfront un réseau comportant de très nombreux serveurs, répartis aux quatre coins de la planète, situés près des utilisateurs, et donc aptes à servir le contenu plus rapidement en en gardant une copie dans un cache local. Cloudfront est exclusivement capable de servir du contenu stocké sur S3, que l'utilisateur peut rendre disponible en créant des "distributions".
La mise en place d'un CDN nécessite que les médias servis par le CDN (les images, les feuilles de style, les fichiers javascript, les vidéos volumineuses, etc.) soient placés sur un sous-domaine différent du domaine principal. Par exemple, pour le site web http://www.clever-age.com/, une idée de sous-domaine adéquat serait http://medias.clever-age.com/ (ne cherchez pas, ça n'existe pas... pour l'instant !). Dans le cas d'Amazon, ce sous-domaine est personnalisable client par client (le nom "Amazon" n'apparait pas dans l'url des contenus hébergés), et est un CNAME vers un sous-domaine de la forme http://hadopivomi.cloudfront.net/.
Les critères permettant d'évaluer quel est le serveur du CDN à partir duquel l'utilisateur télécharge un contenu peuvent varier : proximité géographique, nombre de nœuds réseau à parcourir, coût potentiel de l'acheminement, etc. C'est à la mise en place du CDN qu'est décidée la stratégie de redirection du trafic. Dans le cas spécifique d'Amazon Cloudfront, c'est la proximité réseau qui est prise en compte. Lorsqu'un utilisateur tente donc d'accéder au contenu http://media.lacot.org/cs/styles.css, les serveur DNS de Cloudfront (ns-01.cloudfront.net et ns-02.cloudfront.net) renvoient une liste d'adresses IP convenables pour l'utilisateur. Les serveurs situés à ces adresses IP, situés au sein du réseau d'Amazon, rapatrient alors le contenu depuis le bucket S3 où le contenu est stocké, en font une copie locale qu'ils servent alors à l'utilisateur.
Voici un schéma global, montrant une architecture tirant partie des services offerts par AWS :

Un exemple d'architecture tirant partie des services d'Amazon
Si les solutions offertes par Amazon sont encore en béta, elles permettent dés maintenant de mettre en place des architectures évolutives, performantes et maîtrisées, ce que peu d'hébergements peuvent prétendre. Néanmoins, les services d'Amazon souffrent de certaines limitations, ou sont en tout cas sujets à certaines questions :
by Xavier Lacot (xavier@lacot.org) at June 01, 2009 02:45 PM
Chacun se souvient de la déclaration d’impuissance de François Mitterand :
« Pour le chômage, on a tout essayé»
Jean Marc Daniel rappelle à ce propos l’incapacité structurelle des économies politiques depuis des décennies :
Feu le président Mitterrand était accusé d’avoir une culture économique limitée. Lorsque, agacé, il voulait montrer que finalement il en savait autant que bien des experts, il déclarait avoir parfaitement assimilé que la politique économique se résumait en trois mots : « essence, tabac, alcool ». Il racontait en effet avoir constaté, tant comme ministre de la IVe République que comme président de la Ve, qu’après de longs développements les hauts fonctionnaires du ministère des Finances, quels que soient leur degré de connaissances économiques et leurs prétentions affichées en la matière, finissaient toujours par déclarer que la solution aux problèmes de l’heure passait par un redressement budgétaire, qui lui-même passait par une augmentation des prix de l’essence, du tabac et de l’alcool…
Dès qu’il est question de budget pour mener une politique économique, la réponse à toujours été la même depuis l’invention de l’économie politique :
En 1786, William Pitt, le futur adversaire de Napoléon qui mourut du chagrin que lui provoqua Austerlitz, demanda des conseils à Adam Smith. Ce dernier lui recommanda d’équilibrer le budget et pour ce faire d’augmenter les taxes sur le tabac, l’alcool et les transports…
Les taxes sur les drogues légales : tabac, alcool, jeux, puis les taxes sur les transports, et notamment sur l’essence, ont toujours été le refuge des échecs des politiques économiques.
Et, comme il en faut toujours plus pour combler des déficits toujours plus importants, ont étend l’assiette des revenus en multipliant les techniques pour verbaliser les pratiques en matière de transport : radars automatiques, permis à points. Le tout accompagné d’une politique des objectifs que doivent porter de gré ou de force policiers et gendarmes (la fameuse « culture du chiffre» que dénoncent des syndicats policiers).
Pour trouver des relais qui ne suffisent toujours pas en ces temps d’explosion du chômage, soit on innove soit on reproduit la veille recette à de nouveaux territoires. Incapable d’innover, le gouvernement a cru être fort inspiré en décidant d’appliquer les bonnes veilles méthodes à internet avec la loi Hapodi (c’était d’autant plus « bien joué» que, dans la foulée, on s’attirait la sympathie des artistes). Il n’est d’ailleurs pas surprenant que les promoteurs de la loi scélérate aient usé et abusé des métaphores du permis à points et de la mise ne place des radars pour expliquer la nécessité de cette loi.
In fine, ce que l’on a voulu nous expliquer, c’est que la volonté politique du gouvernement avait le courage de s’attaquer à ces zones de non-droits, alors qu’il s’agissait tout simplement d’une extension mécanique des recettes de l’économie politique. Par où l’on voit que dans les gouvernements, et au ministère des finances, la culture de la médiocrité en matière d’économie politique se perpétue de génération en génération.
Face à ce constat largement partagé, nous étions certains à penser que la question d’une nouvelle économie politique serait au coeur des enjeux de l’élection européenne : à cause de la crise, de l’explosion du chômage, de la fin d’un modèle industriel, etc.. Il n’en est rien, et chacun des partis politiques de premier plan ( UMP, PS, et MODEM ) brille par son silence et justifie en ce sens les propos de Stiegler qui disait récemment à la radio que les partis politiques ne travaillent plus.
Il faut souligner tout de même que les Verts, via l’influence de Yann Moulier-Boutang, ont introduit dans leur discours l’enjeu des externalités. C’est une première initiative importante puisque la question des externalités constitue la clef pour la mise en place du revenu universel (ou allocation universelle) comme moteur de l’économie de la contribution.
Nous sommes allés, en marchant, à l'exposition « La vitesse et ses limites » qui se tient au Centre Canadien d'Architecture.
L'exposition se décline sur quelques thèmes touchant à la vitesse, sa mesure, sa perception, etc. Il n'y a que peu ou pas de continuité entre les différents éléments de l'exposition. Et parfois un contexte un peu faible rend l'exposition moins accessible.
L'exposition commence sur une réflexion courte se résumant à ceci. Si on réfléchit à l'histoire de la vitesse, c'est qu'elle est peut-être à sa fin. Avec la dématérialisation des supports de la connaissance ainsi que de l'interconnexion directe, nous sommes dans une époque d'ubiquité de la vitesse. En cela, il s'agit peut-être de la fin de la conquête et du passage à l'osmose. Cependant, certains mouvements pronent le temps choisi et réfléchi.
à voir tout de même, beaucoup de richesses.
Il est toujours intéressant de regarder la façon dont est traitée l'information. Entre recopie du communiqué de presse à une interaction réelle.
Here is a screencast I've just made about SPARCool for tomorrow's SFSW Challenge, as I'm unfortunately not in ESWC this year.
The list of challenge submissions and related papers is online and here's the SPARCool one.
Un gros travail d’édition pour cette 5ème soirée de la cynoTV. En effet le sujet de ce soir est composé de vidéos soigneusements choisies. Il s’agit d’une collection de vidéos, principalement de la telelibre, qui m’ont marqué pendant les élections de 2007. L’interview d’Imad Lahoud ou bien le reportage à Cormeilles avaient été des éléments clés dans mes intentions de vote. Il me semble qu’au jour d’aujourd’hui la liberté d’expression et la désinformation sont toujours d’actualité. C’est à nous citoyens, d’être les distributeurs de l’information d’hier, d’aujourd’hui et de demain. C’est dans cette optique que j’ai réalisé l’édition de ce soir, vous y trouverez des vidéos vues plus d’un million de fois et d’autres moins de 100. Et puis comme d’habitude: la série, le journal et 2 artistes avec une dédicace au Quebec.
Pour démarrer votre soirée cliquez sur la perle ci-dessous, faites “play” et naviguez avec les fleches.
Au programme: (1 heure 15 min)
Passez une très bonne soirée sur cyno.tv ![]()
J’ai aussi découvert une petite soeur à la cynoTV: il s’agit de teoTV, avec un format plus court, et déjà 2 éditions.
Je soutiendrai ma thèse "Technologies du Web Sémantique pour l'Entreprise 2.0" le mardi 9 Juin à 10h30 à la Maison de la Recherche, 28 rue Serpente, Paris.
Résumé:
Les travaux présentés dans cette thèse proposent différentes méthodes, réflexions et réalisations associant Web 2.0 et Web Sémantique. Après avoir introduit ces deux notions, nous présentons les limites actuelles de certains outils, comme les blogs ou les wikis, et des pratiques de tagging dans un contexte d'Entreprise 2.0. Nous proposons ensuite la méthode SemSLATES et la vision globale d'une architecture de médiation reposant sur les standards du Web Sémantique (langages, modèles, outils et protocoles) pour pallier à ces limites. Nous détaillons par la suite différentes ontologies (au sens informatique) développées pour mener à bien cette vision : d'une part, en contribuant activement au projet SIOC - Semantically-Interlinked Online Communities -, des modèles destinés aux méta-données socio-structurelles, d'autre part des modèles, étendant des ontologies publiques, destinés aux données métier. De plus, la définition de l'ontologie MOAT - Meaning Of A Tag - nous permet de coupler la souplesse du tagging et la puissance de l'indexation à base d'ontologies. Nous revenons ensuite sur différentes implémentations logicielles que nous avons mises en place à EDF R&D pour permettre de manière intuitive la production et l'utilisation d'annotations sémantiques afin d'enrichir les outils initiaux : wikis sémantiques, interfaces avancées de visualisation (navigation à facettes, mash-up sémantique, etc.) et moteur de recherche sémantique. Plusieurs contributions ont été publiées sous forme d'ontologies publiques ou de logiciels libres, contribuant de manière plus large à cette convergence entre Web 2.0 et Web Sémantique non seulement en entreprise mais sur le Web dans son ensemble.
La soutenance est publique, si le sujet vous intéresse, n'hésitez pas !
Le mémoire et les slides seront également postés sur ce site par la suite.
L’ open source c’est cool.
Ouahh, c’est super original comme première phrase dis donc, je me surpasse sur ce blogue
Je voulais partager avec vous ma première véritable expérience d’open source. A part quelques composants crées sur Prado, je dois bien dire que ma participation dans les technologies open source que j’utilise est restée bien limitée. Cela était lié probablement au fait que je sautais d’un projet à l’autre, d’une techno à une autre, sans avoir l’opportunité de maintenir et supporter le code que je diffusais à la communauté. Ce qui était sûrement lié à l’époque à ma condition d’étudiant. Avec pearltrees et un environnement techno plus stable, les choses changent. Rendre son code open source rentre alors dans une logique stratégique, financière et un peu moins idéologique.
C’est dans cette optique que j’avais publié début décembre le workaround d’un bug flash majeur. Ce bug concerne tous les claviers non qwerty et doit être résolu clavier par clavier. Après avoir extrait du code de pearltrees et ajouté un peu de documentation, j’ai mis en place une procédure pour faciliter la création d’un fix pour d’autres claviers. Aujourd’hui cet article a été lu plus de 1000 fois, j’ai reçu les participations de 3 développeurs et le code supporte maintenant 5 claviers: français, belge, suisse, allemand et arabe. Même si depuis peu ce workaround n’est plus utilisé dans pearltrees, sa compatibilité avec un maximum de clavier était primordial, nous avons déjà des communautés naissantes en Pologne, Italie, Russie et d’une mannière générale reçu des connexions de 95 pays différents.
Une première expérience très enrichissante. Et quelque chose me dit que ce n’est qu’un début.
Une annotation est comme un graffiti, un commentaire, une note de pied de pages, c'est une information supplémentaire dans l'espace contextuel de la page.
Dan Brickley a envoyé un message récemment sur la liste Web sémantique du W3C à propos des annotations sur le Web. Il est conseiller sur un projet à but non lucratif dont les objectifs sont proches de l'ancien Annotea.
Annotea est un projet de collaboration grâce à des annotations de pages Web. Les annotations (commentaires, notes, explications, etc.) peuvent être attachées à tout le document ou juste une partie du document sans modifier le document en question. Les annotations sont stockées sur un ou plusieurs serveurs distants. Le système utilisait principalement RDF pour le schéma d'annotations et XPointer pour localiser les données dans la page exactement. Un manuel d'annotea montre pas à pas comment créer des annotations.
De nombreuses compagnies sont nées et sont mortes autour de cette idée mais pratiquement aucune permettant un échange réellement ouvert. Et pourtant, cela pourrait donner l'occasion de développer des systèmes de signets et de commentaires sur les carnets Web sans… commentaires. Dan, dans son message, pointe vers un article d'avril 2007 de Techcrunch sur le même sujet. Les commentaires de cet article sont un cimetière d'éléphants. En deux ans, le nombre de sociétés, startup qui ont disparu est assez impressionnant. Mais comme le dit Dan, aucune compagnie n'a vraiment créé un système libre de commentaires et revues sur le Web réalisé avec un protocole et des formats ouverts. Et pourtant… il y a pléthore.
En réponse à Dan Brickley, on peut trouver quelques pistes d'explorations.
Annozilla est une extension afin de pouvoir utiliser Annotea dans Firefox. Cela rentre dans la politique de Générativité que Tristan a décrit récemment.
Un système d'annotation sur le Web utilisant RDF. Le projet semble actif. Un petit manuel d'installation est disponible, ainsi qu'une API. Le nom vient de la tour Cabot et semble être utilisé sur le site CREW. Malheureusement, il ne permet pas d'annoter une partie de page.
Phil Archer rappelle que POWDER, qui sera bientôt en Recommandation proposée, est un système d'annotations et de description de ressources. Les scénarios d'utilisation couvrent la création de système de confiance décentralisé, d'évaluation de contenu et recherche dans le cadre du Web sémantique.
Media Annotations est un groupe de travail du W3C qui travaille sur la définition d'une ontologie et d'une API pour accéder les métadonnées contenues dans les formats Video. Mais le travail en est à ses débuts.
Un serveur implémentant Annotea spec en Java, compatible avec Annozilla, mais toujours en beta. Ils ont également développé un prototype de client, Dannotate qui normalement fonctionne dans tous les navigateurs enfin presque.
Matthew se lance dans la description de quelques enjeux :
Il complète, après la réponse de Dan Brickley, qu'il a eu des difficultés avec l'API de Mozilla.
Et vous, qu'utilisez-vous ?
Il y a un projet sur lequel je travaille depuis un moment maintenant dans le cadre de mes prestations et que j'ai décidé de libérer (sous licence BSD) car je pense qu'il peut être utile à pas mal de monde : Django-ROA.
Il s'agit de pouvoir gérer ses ressources distantes normalement accessibles en REST directement via l'ORM et les modèles de Django. Le module va s'occuper (comme le montre le merveilleux schéma ci-dessous) de convertir la requête Django initiale en une requête HTTP et de convertir/déserializer la réponse en un objet Django :
Ok pour le fonctionnement mais qu'en est-il des applications ?
Le module a originellement été développé pour s'intégrer dans les architectures orientées services (SOA) ayant une contrainte REST (d'où le ROA). Cela signifie que vous pouvez brancher votre application sur une base de données métier sous réserve qu'elle ait une interface HTTP. Ce qui ouvre la porte aux bases non supportées par Django nativement, aux entrepôts de données et aux multi-databases puisque vous pouvez spécifier une URI par modèle... Soyons encore plus fous, CouchDB parle le HTTP, et bien il suffirait d'un connecteur approprié pour pouvoir accéder aux documents via des modèles Django !
Lors d'EuroDjangoCon, Jesper venait de sortir django-piston (qui est utilisé pour les tests de django-roa) et faisait des tests d'application sur Pinax. J'ai pu vérifier en communiquant avec l'API mise en place sur sa machine que je pouvais éditer des objets Pinax via une interface d'administration de Django qui était lancée sur ma machine. Ce qui signifie que l'on pourrait imaginer une interface d'administration commune à plusieurs projets (pas forcément Django) présentant des API.
Si vous avez d'autres idées d'applications, n'hésitez pas à laisser libre cours à votre imagination. Je n'ai pas parlé de RDF mais vous pensez bien que ce module est une partie intégrante de ce que j'ai appelé architecture moderne et agile ;-).
Je ne vais pas reproduire la doc ici mais c'est relativement simple, il suffit d'hériter du Model de django-roa et de définir l'URL de la ressource avec la méthode get_resource_url_list.
Après, il y a beaucoup de settings et méthodes pour configurer tout ça, le plus intéressant pour découvrir le module est probablement ROA_MODELS qui permet de passer facilement d'une architecture locale (pour développer) à une architecture orientée ressources (pour tester grandeur nature). Sinon la lecture des tests peut être d'une grande aide.
Notez qu'il est nécessaire de patcher Django (du moins pour l'instant) avec le patch lié au ticket #10109 pour pouvoir utiliser le module avec les relations ManyToMany.
En testant le module dans un premier temps, en enrichissant la documentation au besoin (je peux facilement vous laisser des droits si vous avez un compte BitBucket), en proposant des patchs ou tout simplement en discutant des concepts.
J'aurais le plaisir d'en présenter brièvement les détails lors de Pycon-fr (dimanche après-midi) où j'espère vous retrouver nombreux. Il y aura aussi un atelier Django le samedi après-midi pour ceux et celles qui voudraient s'y mettre !
Django-ROA, pour une architecture orientée ressources
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 26 mai 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
by David Larlet at May 25, 2009 10:00 PM under WebSemantique
À chaque ère technologique, son nouveau lot de débats, nous débattons des mérites et des dangers de ce nouvel élément alors que bien souvent nous ne reprenons que d'anciens thèmes souvent tournant autour du pouvoir, du territoire, de la possession. Je me demande souvent souvent quelle est la part de la mémoire dans ses débats.
Bien que l'ère numérique soit bien présente, nous sommes toujours dans les civilisations modernes dans une tradition de l'écrit. Nous signons des contrats sur papier. Nous imprimons un justificatif de paiement sur papier (même lors d'un paiement par carte). Il n'y a pas bien longtemps, nous devions envoyer un ordre de commande par fax. L'enseignement oral se maintient sur le papier : les manuels scolaires. La transition s'opère vers le monde numérique. Les nouvelles pratiques se développent. Les anciennes se convertissent ou meurent.
Certains livres enluminés (la majorité), réalisés manuellement, ne sont jamais passés au monde de l'imprimé. De nombreux livres ne passeront jamais au monde numérique (coût trop important). Les générations futures auront pour mémoire la somme des connaissances actuellement développée pour le monde numérique. Ce n'est pas un constat négatif. J'ai l'impression que la richesse accessible dans le monde numérique est déjà suffisamment importante. En revanche, combien cette « coupure de la mémoire » influence-t-elle nos débats ?
La mémoire diffusée largement est un outil de contrôle ou de déstabilisation. On le remarque notamment dans les tentatives de lois autour de l'interdiction de filmer les interventions policières. L'image en tant que preuve bien souvent remplace la preuve par le papier. Voir pour croire. Il ne faut pas oublier que ce n'est pas un phénomène nouveau. Nous avons eu Jeanne d'Arc, et Bernadette. Elles ont vu, donc on peut croire. La vision est aujourd'hui distribuée et enregistrée. Nous avons élargi le périmètre de l'authenticité. Et pourtant nous devrions pas perdre notre sens critique face aux images. Elles peuvent être l'objet de la même illusion (manipulation) que celle de Bernadette.
Le clergé contrôlait la reproduction des textes en Europe. La xylographie entame les premières étapes de la publication industrielle. Une pièce de bois complète sculptée du texte de la page. En Chine, on imprime des textes bouddhiques au VIIe siécle. L'imprimerie à caractères métalliques a été inventée en Corée pour imprimer le Jikji en 1377. Des mondes clos, une mémoire peu diffusée et oubliée, l'imprimerie devient une invention européenne et elle le fût dans le contexte de la grotte de l'Europe. (N'ayons pas peur de nos ombres). Détail à ne pas oublier, Gutemberg a fait un « flop » à sa génération. Aujourd'hui les éditeurs (de musique et de livre) s'inquiètent, tentent un un dernier cri, mais tous comme les moines en leur temps, ils perdront le contrôle. Nous avons oublié cela dans nos débats. Le droit de « copie » devient désuet lorsque la copie ne pose plus aucune difficulté technique et est accessible à tous.
Lors que nous engageons des débats à propos d'internet, du Web, du monde numérique, des droits de copie, parlons nous en fait de mémoire, de sa permanence, de contrôle ?
Je voulais faire un n-ième article sur l'emprise de Google mais j'ai finalement plus constructif à faire. Je vous laisse donc avec les trois articles qui résument assez bien la situation des problèmes du récent (non-)support de RDFa par Google : Google's RDFa Support de Jeni Tennison, Google’s RDFa a Damp Squib de Ian Davis et Google and RDFa: what and why - Surprise—to make more money! de Bob DuCharme.
Je m'abstiendrai de tout commentaire concernant Microdata, car ce serait trop facile (même si je m'en suis donné à cœur joie sur twitter). Il faudra que je prenne le temps de lire la proposition de RDFa dans HTML 5 par contre.
J'aurais pu aussi troller sur le support annoncé tambour battant en tant que consommateur d'OpendID par Facebook qui au final n'accepte que les OpenID Google (et à moyen terme Yahoo! et Microsoft si j'ai bien suivi), on fait difficilement plus Open, hem.
Allons de l'avant plutôt, avec la présentation de Chris Messina intitulée The open, social web ou l'article de Nova Spivack Welcome to the Stream: The Next Phase of the Web (traduit en français). Encourageant aussi, la possibilité (enfin !) de lier son identité à son navigateur grâce à Mozilla Weave.
Les droits utilisateurs à l'échelle du web commencent à se mettre en place aussi avec les WebAccessControl ou WriteWebOfData et dans l'autre camp avec ProtectServe (à lire dans l'ordre chronologique).
Ça avance, trop lentement à mon goût, mais ça avance. Je serais très certainement aux RMLL à Nantes début juillet pour parler de tout ça d'ailleurs.
Google Rich Snippets et RDFa : incompétence ou intérêt ?
a été rédigé par David Larlet pour
biologeek.com et a été originellement
posté le 24 mai 2009. À part exceptions, c'est
©2004-2009 David Larlet et sous licence (presque) libre autorisant
la reproduction, la distribution et la modification sous certaines conditions.
Veuillez les respecter.
by David Larlet at May 24, 2009 03:19 PM under WebSemantique
Une idée simple et un mashup. 4 heures dans OmniGraffle. J'ai créé un t-shirt pour identi.ca.
Bob DuCharme a récemment effectué un travail remarquable (EN) où il synthétise sa perception de l’état actuel du web sémantique. Ca vaudrait un petit coup de traduction tellement c’est bien
J’ai trouvé assez intéressante sa division entre “LinkedData” et “web sémantique”. Le LinkedData est un écosystème ou les données sont structurées et partagées de manière standard (voir la vidéo de Tim Berners Lee que j’avais traduite). Nous avons donc des données brutes qui circulent et s’enrichissent. Ce qui représente le mieux le LinkedData c’est bien évidemment ce schéma:

Les technologies utilisées pour réaliser cette première vision du web 3.0 sont: RDF, SPARQL et une communauté de passionnés, visionnaires? C’est le LinkedData.
Bob DuCharme place alors le web sémantique au dessus. Il permet d’effectuer des raisonnements sur cet écosystème qu’est le LinkedData. C’est la vision ultime de Tim Berners Lee. La technologie utilisée ici est elle aussi standardisée: OWL.

Le LinkedData commence déjà à faire pousser pleins de jolies fleurs. Le web sémantique sera une explosion de lumière. ouai, ouai, rien que ça. Au final j’aime bien cette séparation entre LinkedData et web sémantique. Le terme sémantique a alors tout son sens et on évite les confusions entre “partage de données structurées” et “reasoning”.
Alors bien loin d’être naif, ou influencé par l’industrie des telecoms, les créateurs du web de demain battissent un nouvel écosystème. Better, faster, stronger.
Et pour en apprendre plus sur le web sémantique, la cacarte qui va bien:

Internet Explorer is the bad. Even if it is said to support the mime type */* since long, it indeed never supported application/xhtml+xml, the recommended mime-type for xhtml pages. When trying to display pages with this mime-type in IE8 or previous editions, Internet Explorer just proposes to download the page - needless to say that it will prevent some of your visitors to see the wonderful content of your pages.
Therefore, in order to get displayed in these browsers, web standards compliant websites must use the more common text/html mime-type. Indeed, the best what a developer can do is to serve the pages as application/xhtml+xml in all browsers except in those that don't accept it. Here is a simple filter for achieving this job in Symfony applications:
<?php
class nonApplicationXhtmlXmlCapableBrowsersFilter extends sfFilter
{
public function execute($filterChain)
{
// execute next filter
$filterChain->execute();
// execute this filter only once
if ($this->isFirstCall())
{
$content_type = sfContext::getInstance()->getResponse()->getContentType();
if ((false !== stripos($content_type, 'application/xhtml+xml'))
&& (false === stripos($_SERVER["HTTP_ACCEPT"], 'application/xhtml+xml')))
{
sfContext::getInstance()->getResponse()->setContentType('text/html; charset='.sfConfig::get('sf_charset'));
}
}
}
}
Put the code somewhere in your project, clear the cache and just activate the filter in the apps/APPLICATION_NAME/config/filters.yml:
rendering: ~
security: ~
# insert your own filters here
nonApplicationXhtmlXmlCapableBrowsersFilter:
class: nonApplicationXhtmlXmlCapableBrowsersFilter
cache: ~
common: ~
execution: ~
In conclusion :
C'est une histoire simple. Place aux images…
Les avis sont partagés, ils ne devraient pas. Le mois dernier Joshua Schachter, fondateur de del.icio.us, écrivait un excellent papier sur les dangers des URLs shortners. Elles fragilise le web, créant un “point of failure” critique dans la résolution de liens. Jusqu’à présent il existait uniquement trois acteurs dans l’écosystème d’un lien: l’éditeur du contenu (la cible du lien), le lieu de transit (là où le lien est placé) et enfin la personne qui clique. Aujourd’hui se rajoute un acteur sur le lieu de transit puisque la cible est maintenant opaque. Il faut donc passer par un acteur tier pour résoudre l’adresse finale du document web. La pérennité du lien n’est plus assurée uniquement par le lieu de transit mais aussi par ce nouvel acteur. Et il peut arriver beaucoup de choses chez un fournisseur de short URL: perte de base de données, problèmes réseaux, problèmes matériels, hack avec risque de phishing, problèmes économiques pour l’entreprise… les URLs shorteners sont dangereux et ne créent aucune valeur pour les utilisateurs. Comme le suggère techcrunch, Twitter aurait pu depuis bien longtemps permettre de créer des liens sur les mots du message au lieu d’afficher l’URL brut. Mais il y a sûrement une bonne raison (économique ou stratégique) pour ne pas le faire… Sur Techcrunch, près de 2000 votants déclarent à seulement 60% que les URLs shorteners sont néfastes. Du côté de mashable, les versions FR comme US présentent les nouveaux shorteners à la mode. C’est la même chez RWW avec l’apologie de bit.ly en anglais et en français. Warning.
Un livre est souvent l'œuvre (texte ou photographie) d'un ou plusieurs auteurs qui a été découpée, imprimée sur des feuilles de papier et finalement assemblée. Il y a eu fabrication d'un objet particulier. Dans notre monde contemporain, nous identifions les objets par des références afin de mieux les manipuler et les stocker. De grands entrepôts (les bibliothèques) conservent ces objets. Afin de pouvoir gérer l'objet et le commerce autour de l'objet, afin de pouvoir stocker et retrouver, nous avons établi la classification.
Dans un monde physique où la manipulation de l'information est réalisée essentiellement par l'échange d'objets, l'identifiant est contrôlé par ceux qui ont le pouvoir de production et diffusion.
Cependant, dans le monde numérique d'un large réseau interconnecté, le contrôle de l'identifiant est distribué sur un grand nombre de personnes.
En créant un texte ici, je crée un identifiant http://www.la-grange.net/2009/05/19/catalogue. Une autre personne peut décider de créer une url plus courte pour ce texte en utilisant un service comme http://bit.ly/ (compacteur d'url). Une autre personne peut décider de garder une copie de ce texte sur son ordinateur ou de le mettre en ligne à un autre endroit. L'identifiant et la diffusion ne sont plus du tout contrôler par le créateur mais par les utilisateurs.
La librairie du congrès américain est l'un des pourvoyeurs d'un système de classification des livres. Ils ont créé un fichier SKOS (format de description de taxonomie en RDF) afin de décrire leur système de classification. Il existe dans ce catalogue des choses étranges qui le rende bien poétique. Comme par exemple une URI pour le Boulevard Saint-Laurent à Montréal.
http://id.loc.gov/authorities/sh94006536#concept
À cette URI sont associées deux œuvres. Karen Coyle reproche au catalogue de ne pas être complet. Par exemple, le concept Italie n'existe pas alors que le mot « Italy » se retrouve dans l'entête de 3516 concepts. Cependant, je ne peux m'empêcher de penser que c'est bien le résultat d'une approche pyramidale d'un autre temps. Une institution unique diffuseur d'une information gère son propre catalogue car il représente un sens logique dans l'environnement physique de la librairie du congrès. Une fois échappé les murs de la librairie, ce catalogue se retrouve confronté aux réalités propres des utilisateurs.
Dans le recueil de la conférence sur L'identité (p. 278) organisée par Claude Lévi-Strauss, un texte Pourquoi Nommer ?, Françoise Zonabend écrit :
Ces toponymes assortis de l'article n'apparaissent jamais au cadastre, ils ne seront jamais cristallisés par l'écriture. Intelligibles seulement à une ou deux familles, parfois à un groupe de voisins, à une classe d'âge, ils ne durent qu'une ou deux générations puis sont oubliés au profit d'autres dénominations.
L'identité (p. 278) - Claude Lévi-Strauss
J'avais écrit suite à cette lecture, le billet Des espaces dont on ne sait rien. Les catalogues et les classifications d'objets sont dépendants de la structure et du contexte de ce catalogue. Une carte géographique ne comprend pas tous les mots possibles, car elle ne dévoile que l'information nécessaire dans un contexte précis. Elle est autant un travail d'élagage de l'information, plutôt qu'un travail d'universalité et de complétion. Il en va de même des catalogues de librairie. Ils n'ont pas vocation à être complet. En revanche, le fait que le catalogue de la librairie du congrès soit au format SKOS (RDF), permet de l'étendre très facilement.
Le Where of Who est pour moi l'expression du contexte local, le référentiel sociocentrique. Je ne décris pas le monde en fonction de ce que l'on me dit du monde mais également de la façon dont je le nomme. Les rues, les espaces autour de moi ont leur nom propre qui ne figurent pas nécessairement dans le cadastre de la ville de Montréal. Les livres sur mes étagères ne sont pas organisés selon le numéro ISBN, ou selon le catalogue de la librairie du congrès. En fait, ce que doivent réaliser, éditeurs, libraires, etc, c'est qu'ils n'ont jamais contrôlé la classification et la diffusion des livres, si ce n'est uniquement dans l'enceinte des contraintes physiques du monde qu'il contrôlait.
Le réseau permet aujourd'hui de diffuser largement les référentiels sociocentriques. Chaque classification personnelle, intime, est visible. L'œuvre est décorporée du livre, diffusée et reclassifiée au bon vouloir de chacun.
Alexandre Passant note dans un billet les conflits trouvés dans le nuage de données (le Web sémantique). Ce type de découverte va s'accentuer pour deux raisons : les erreurs et les conceptions du monde qui sont différentes. Cela n'est pas une faiblesse, c'est normal. Le monde s'exprime dans une diversité de possible.
Et que quelques milliards de catalogues s'épanouissent…
by martinlessard at May 19, 2009 01:13 AM under WebSemantique
The Party, 1968, de Blake Edwards, avec Peter Sellers.
Ce film est une véritable partition de musique, une chorégraphie comique. Assurez vous de ne pas avoir envie avant de regarder l’extrait, car vous comprendrez le vrai sens de l’expression « se pisser dessus» .
On rendra également hommage au génie de Peter Sellers qui, de la seconde 6 à la seconde 14, dans un changement de regard, exprime tant de choses…
While I was wondering how to embed SPARCool results in webpages without having to rely on server-scripting (namely PHP) nor facing AJAX cross-domain security issues, I got two requests asking if it could support JSONP. I figured out it was exactly what I was looking for, so a big thanks to Claudia and Rob for suggesting it !
It was quite straightforward to implement, and SPARCool now supports JSONP callbacks. So, one can call results using AJAX to dynamically embed SPARCool results in webpages (for instance, jQuery provides an easy way to use JSONP with it). It hence allows to construct dynamic pages using Linked Data resources without having to type any line of SPARQL code (e.g. listing members of a project, description of a resource, etc.). For instance, check the updated sparcool.net page and the new example at the bottom, listing - on runtime - all the members of the Clash, via a DBpedia through a SPARCool URL.
Enjoy !
Depuis que je travaille dans le monde absurde des agences Web, mon besoin de poésie et de beauté est de plus en plus aigu. Alors au gré du courant, entre les fibres de photon, je me laisse porter par la magie du réseau. Que c'est beau.
Le ballon rouge est un film de 1956 réalisé par Albert Lamorisse.
Extrait du ballon rouge
J'ouvre le petit livre rouge de Mao. La lecture en est toujours étonnante entre subjugation et consternation. Les messages sortis de leur contexte historique et recontextualisé prennent des allures loufoques.
The organs of state must practise democratic centralism, they must rely on the masses and their personnel must serve the people.
Tse-Tung, Mao. Quotations from Chairman Mao Tse-Tung. Foreign Language Press, Peking 1966. p. 171
L'artiste Ian Wright a réalisé un portrait de Mao en bouton couvert de soie.
Bien sûr d'une jeunesse emmenée par le cyclone Mao, l'autre au Japon (photos du magazine Life en 1964), au même moment découvrait un autre cyclone, celui de la consommation américaine, quelques années après le temps de Crazed Fruit.
Shimokitazawa, un des villages de Tokyo, est toujours excessivement présent dans mes veines. Le bruit des corbeaux, des scooters et des pas de femmes qui parcourent les rues, les empreintes sonores vibrent toujours.
Le système bancaire crée un environnement qui nous détourne de la valeur des choses. D'un système de compensation de valeurs (eviter la circulation de l'or) à un système de stockage de la valeur (mettre en banque l'argent pour des besoins du futur) nous sommes finalement passés à un système d'avance de valeur (le crédit pour acquérir maintenant, les subprimes aux États-Unis). Mais imaginons un instant qu'il n'y a pas de banques, comment échange-t-on la valeur ? Quelles sont les priorités ? C'est ce que l'on retrouve dans le carnet de l'économie du prépayé.
Également, les personnes possèdent rarement de l'argent sous forme de monnaies durablement, pour la plupart du temps, car ils n'ont pas accèss aux banques et/ou à cause du coût de maintenance prohibitif par rapport à leurs revenus. La monnaie est très rapidement convertie en biens en fonction des priorités et ces « biens » deviennent des assurances (argent), économies (acheter des matériaux de construction pièce par pièce jusqu'à ce que la maison puisse être construite), un matelas c'est à dire une assurance (vendre un porc pour une urgence ou consommer pour la nourriture) et finallement investissement (lait venant d'une vache, jeune cochonnet à amener à maturité, etc.)
Bahn, Niti. Some observed behaviour patterns in rural BoP households, The prepaid Economy Blog.
Des montages de cartes, d'illustrations et de papiers par Shannon Rankin, un petit film par Jeff Desom, utilisant de vieilles images trouvées à la bibliothèque du congrès américain et en les animant, une collection de photographies réalisées avec un iphone par Chase Jarvis, qui souligne que le meilleur appareil photographique est celui près de vous. J'approuve. Un barbier en Inde par Diti Kotecha. Des artistes prenant possession, pour un instant, de l'espace de consommation, comme Nicolas Labbé. Et tant d'autres…