Семантический веб
RDFa и Drupal
В прошлом году я написал статью в блоге с заголовком Drupal, семантический веб и поиск, где обрисовал как поисковые системы типа Google и Yahoo! все больше жаждут структурированных данных. Это не удивительно, потому что, если они могу построить глобальную, вертикальную поисковую систему, котороя, например, ищет все товары онлайн, или, которая ищет все предложения работы онлайн, то они смогут убрать многие существующие компании.
Меня больше волнует то, как поисковые системы могут помочь ускорить создание семантического веба, создавая эти вертикальные поисковые системы, и роль, которую системы управления контентом типа Drupal будут в этом играть. Сотни сотен Drupal-сайтов содержат огромное количество стуктурированных данных по самым разнообразным тематикам. К сожалению, эта структура спрятана глубоко в базе данных Drupal и никак не отражается в HTML-коде, который генерирует Drupal.
В своей презентации на DrupalCon в Бостоне в прошлом году поднял вопрос о том, что нам нужно добавить поля в ядро и сделать их главными. Как только поля будут реализованы, они могут быть ассоциированы с ценными, семантическими мета-данными, которые Drupal может выводить в XHTML как RDFa. Например, у нас есть HTML текстовое поле, которое содержит число и мы определяем его RDF-свойство как 'цена'. Затем семантические поисковые системы распознают это поле как 'цена'. Добавить поля для 'стоимость доставки', 'вес', 'цвет' (и/или любые другие) и возможности становятся очень заманчивыми. Я предвижу, что поля CCK в ядре Drupal смогут это сделать.
Через год после Бостона, Drupal-сообщество сделало в точно то, что я просил. Я планировал показать виде их работы в свой презентации на DrupalCon DC чуть раньше в этом месяце. К сожалению время вышло до того, как я успел показать их. В любом случае это было показано в сессии "Семантический веб и зачем он нам нужен" и сегодня Стефани Корлоскьюэт (Stephane Corlosquet) опубликовал все подробности в группе семантического веба на drupal.org. Видео рисует картину того, что возможно сегодня с помощью Drupal-технологий, но также того, что, вероятно, будет возможно с помощью ядра Drupal в какой-то момент. Прототипы в этом видео построены с использованием дополнительных модулей для Drupal 6. В любом случае, по истечении года мы имеем поля в ядре и мы также уже готовы начать внедрение RDFa в ядро.
Бэн Лэвендрер (Ben Lavender) сделал скринкаст, Джош Хакабии (Josh Huckabee) сделал вид Exhibit, Стефани Корлоскьюэт (Stephane Corlosquet) сделал приложения SearchMonkey и сайт социальной сети. Помогали и другие люди, включая Алекс Поллерес (Axel Polleres) и Андреас Хэрз (Andreas Harth) (создатель VisiNav). Работа над обоими видео и модулями была спонсирована DERI Galway, Harvard IIC и OpenBand.
Состояние презентации Drupal (март 2009)
На прошлой неделе на конференции DrupalCon DC я показывал свою традиционную презентацию о состоянии Drupal перед 1400 Друпалистами. Ниже представлено видео с презентации и вы также можете скачать копию моих слайдов (PDF, 20 Мб). Видео в альтернативных кодировках доступно на archive.org. Темы, которые я поднимал: история Drupal, релиз Drupal 7, будущее Drupal и др. Посмотрите!
Источник: archive.org.
Drupal, семантический веб и поиск
Все основные поисковики, включая Google и Yahoo!, are moving aggressively trying to capture structured data. This isn't exactly a surprise because it provides tremendous opportunity. Let's take the example of product search. Imagine the web as a huge database of millions of products, and search engines like Google and Yahoo! giving you a rich set of controls to filter by price, availability, color, shipping cost, user ratings, and more. Wouldn't it be great to be able to search all the world's products from a single page with a single interface? I'd think so too.
It is waiting to happen; we just have to connect the dots. That is, we have to make Drupal emit structured information.
Hundreds of thousands of Drupal sites contain vast amounts of structured data, covering an enormous range of topics, including product information. Unfortunately, that structure is hidden deep in Drupal's database and doesn't surface to the HTML code generated by Drupal. As such, search engines can't pick it up as a product, and they'd fail to include it in their world-wide product database.
I first talked about the semantic web and Drupal in my DrupalCon keynote last year in Boston. In my presentation, I laid down the challenge that we need to put fields in core and make them first class citizens. Once fields are thus empowered, they can be associated with rich, semantic meta-data that Drupal could output in its XHTML as RDFa. For example, say we have an HTML textfield that captures a number, and that we assign it an RDF property of 'price'. Semantic search engines then recognize it as a 'price' field. Add fields for 'shipping cost', 'weight', 'color' (and/or any number of others) and the possibilities become very exciting. I envision a Drupal core CCK with the power to do just that.
Here is another example. Imagine a standard Drupal node-type called 'job'. The fields in the job node-type would have RDF properties associated with them mapping to salary, duration, industry, location, and so on. Creating a new job posting on a Drupal site would generate RDFa that semantic search engines like Yahoo!'s SearchMonkey would pick up and the job would be included in their world-wide job database.
Technologies like this disintermediate so many existing websites and organizations that it makes my head spin. It is too great an opportunity for us to pass up on. By adding semantic technology to Drupal core, I think we can make a notable contribution to the future of the web.
This kind of technology is not limited to global search. On a social networking site built with Drupal, it opens up the possibility to do all sorts of deep social searches - searching by types and levels of relationships while simultaneously filtering by other criteria. I was talking with David Peterson the other day about this, and if Drupal core supported FOAF and SIOC out of the box, you could search within your network of friends or colleagues. This would be a fundamentally new way to take advantage of your network or significantly increase the relevance of certain searches.
I can has semweb in Drupal core?
Презентация о состоянии Drupal (март 2008)
На прошлой неделе на конференции DrupalCon в Бостоне я делал мою традиционную презентацию о состоянии Drupal перед 850 друпалерами. Видео этой презентации представлено ниже и вы также можете загрузить копию моих слайдов (PDF, 15 Мб). Видео доступно в альтернативных форматах на archive.org.
О чём я говорил: релиз Drupal 6, состояние нашего the state of our union, потребность в редизайне drupal.org, убийственный релиз Drupal 7, цикл разработки Drupal 7, удобство использования (usability), разработка на основании тестов, будущее Drupal и сематический веб, а также другое.
В презентации очень много материала и на протяжении следующих нескольких недель я планирую разбить эту презентацию на несколько статей в блоге. Держите волну!
