Семантическая сеть: где она сейчас?

При всем волнении вокруг Deep Learning и Blockchain легко упустить перспективы других «поддерживающих технологий», особенно тех, которые игнорируются или забыты промышленностью из-за того, что они слишком академичны или нишевы. Gartner ранее в этом году опубликовала свой Цикл ажиотажа для новых технологий 2018 г.а буквально пару месяцев назад Тим Бернерс-Ли объявил о своем мировой план децентрализации Интернета.

Это может быть не сразу очевидно, но обе эти истории имеют одну общую черту: Семантическая паутина.

Оба графы знаний (из отчета Gartner) и RDF (из упомянутого плана мирового господства Солидный проект) являются неотъемлемой частью видения Semantic Web и стек технологий. Вот почему эксперты не согласны с тем, что любая часть этого все еще является шумихой или что он на самом деле «мертв», потому что, хотя окончательное видение, возможно, еще не материализовалось, его побочные продукты все еще в значительной степени действуют.

Даже идея веб-децентрализации, возможно, тихо зарождалась в принципы связанных данныхкоторый можно рассматривать как идеологическую основу для RDF.

Сейчас мы приближаемся к концу 2018 года и вступаем в то, что, возможно, может стать годом Web 4.0. Возможно, настало время сделать один маленький шаг назад для Интернета и взглянуть на то, каким было все это время его грандиозное видение. Мы будем лениво полагаться на графики циклов ажиотажа Gartner (каламбур) на протяжении многих лет, прошедших с момента создания концепции, в сочетании с моими личными академическими исследованиями и опытом применения в отрасли, а также большим количеством мудрости, почерпнутой из самой сети, чтобы представить краткий обзор не Краткая история Semantic Web.


Вовремя т=0 у нас есть известное объявление TBL о его видении интеллектуальной сети в Статья в журнале Scientific American 2001 г..


Популярная цитата из «Семантической паутины» Бернерса-Ли, Хендлера и Лассилы, воспроизведенная

В том же году Gartner своевременно ввел термин Семантическая сеть в качестве новой записи в своем отчете о новых технологиях, предсказывая, что через 5–10 лет он станет промышленно продуктивным. Как и многие технологические вехи, основы уже существовали в то время благодаря многолетним исследованиям в области символический искусственный интеллект (по сравнению с сегодняшним вероятностным ИИ), что дало нам экспертные системы а также базы знаний 80-х годов.


Gartner Hype Cycle for Emerging Technologies 2001, любезно предоставлено

Помимо XML, был разработан абстрактный язык моделирования данных RDF. указано в 1999 г. (это почти 20 лет на сегодняшний день). представление знаний и рассуждения (KRR) специализация ИИ создала прецедент для описание онтологий (думаю, интеллектуальная схема), с простым РДФ-С и продвинутый СОВА Языки онтологии были введены примерно в то же время.

Инструменты, такие как Протеже, Сезам OpenRDF и лаборатория HP Йена уже находились в разработке или использовались в качестве исследовательских возможностей, особенно в биоинформатика.


Gartner Hype Cycle for Emerging Technologies 2006, любезно предоставлено

Набирая обороты примерно через 4–5 лет, мы видим упоминание о Корпоративная семантическая сеть в 2005 и 2006 годах. Это как раз то время, когда язык запросов RDF СПАРКЛ и язык процессуальных правил SWRL (дополняющие декларативные правила OWL).

Базы данных графов RDF или тройные магазины например реклама Франца АллегроГраф а также Кингсли Юи Идеэнс открытым исходным кодом Виртуоз подходили к месту происшествия. Дэйв Беккетключевой игрок в этой области, уже зарекомендовал себя C RDF-библиотеки и разработчики были используя их интересным образом.


Хотя для этого нет отчета Gartner, период с 2006 по 2010 год знаменует собой самое захватывающее время для семантических (веб-технологий). Пик завышенных ожиданий видения, быть может?

Freebase была в полном разгаре, и позже она была приобретена Google и стала основой для ее собственной проприетарной базы данных. График знаний. SPARQL v1.1, OWL v2 и ВРАЩЕНИЕ были введены для обеспечения столь необходимой гибкости запросов RDF, онтологической аналитики и возможностей рассуждений.

За эти годы также были опубликованы три важные книги в этой области: моя любимая Основы семантических веб-технологий, Семантическая сеть для работающего онтологаа также Программирование семантической сети (один из немногих, использующих Python, в то время, когда в этой области доминировала в основном Java и до сих пор).

Университеты также включали ключевые темы в свои программы на получение степени, а профессиональные институты начали предлагать сертификаты. Иными словами, относительно многое происходило относительно, и это отражалось на деятельности как научных кругов, так и промышленности.


Gartner Hype Cycle for Big Data 2012, любезно предоставлено и Gartner Hype Cycle for Advanced Analytics and Data Science 2015, воспроизведенный

События после 2010 года — это совсем другая история, и в ней есть некоторое разочарование. Программные инструменты были заброшены, стартапы замолчали, а организации перестали публиковать (мета)данные RDF в пользу JSON. Идея Semantic Web начала получать какая-то ненавистькак ни странно, от непосредственных участников сообщества, таких как Ману оспаривается.

Gartner на правильном месте Семантическая сеть приближается к корыто разочарования в 2012 году возможное неизбежное падение, подтвержденное Связанные данные находясь на дне корыта в 2015 году.

Однако кое-что хорошее из этого вышло: мультиотраслевая schema.org проект словаря для встраиваемых метаданных (то, что вы знаете как расширенные фрагменты или же семантическое SEO), РДФ сериализация (или альтернатива, если это ваша позиция) JSON-LDпо-настоящему совместимый с OWL2 тройной магазин Стардоги книга Изучение SPARQL (Боб Дюшармх совсем блоггеркстати).



Gartner Hype Cycle for Emerging Technologies 2016, любезно предоставлено и Gartner Hype Cycle for Emerging Technologies 2018, первоисточник

Практичность семантической паутины до сих пор пользуется плохой репутацией, поскольку депрессивная ситуация из-за крутой кривой обучения. Ничто не может быть дальше от истины — RDF чертовски прост, особенно в его Форма черепахи. Любое нетривиальное приложение, независимо от технологии, требует обучения.

Последние несколько лет разочарования, похоже, породили широко распространенные заблуждения и непонимание, но не все потеряно.

Некоторые инструменты и библиотеки, возможно, устарели, но те, которые доказали свою эффективность, продолжают жить. кунжут стал RDF4J, проект Eclipse. Тройное отображение объекта в Java (OTM; подумайте ОРМ для RDF) фреймворков Али Баба (ранее Элмо) и Империя хотя и в меньшей степени, но все еще активны или, по крайней мере, функциональны. питон а также JavaScript тоже не остались в стороне.

Многие организации, возможно, отказались от публикации XML и RDF, но те, для кого данные имеют высокий приоритет, также отдают предпочтение этим стандартам. Европейский союз (ЕС) является большим и сложным многопартийным руководящим органом, и это очевидно из недавние инициативы что они успешно используют такие технологии.

С помощью экспертов и сообщества TopQuadrant превратил SPIN в SHACLкоторый должен сзаменить систему декларативных правил OWL и (отсутствие) проверки данных. Проблема семантических данных в масштабе также получила возможное решение в виде Связанные фрагменты данных.

Даже графовые базы данных альтернативный вид сжиженного нефтяного газа относитесь к RDF как к первоклассному гражданину и обещайте предоставить нам семантику, в которой мы нуждаемся, без сложностей или недостатков декларативных языков и логики описания, таких как монотонность и предположение об открытом мире.


Итак, это все? Не в списке. Модные технологии последних двух лет, часто поддерживаемые стартап-программами и средствами массовой информации, сегодня довольно актуальны. дополнение к семантической сети. Машинное обучение — полезный метод для предоставление вероятностных данных для рассуждений и выводови децентрализованная система учета может принести пользу связанным данным, или наоборот.

TL;DR: Semantic Web — идеальная, а не убийственная технология сама по себе. Также нет одного приложения-убийцы, но есть много прошлых, настоящих и будущих инноваций. Он существует благодаря стандартам и технологиям, которые являются кульминацией различных целенаправленных инициатив. Другими словами, в 2018 году семантическая сеть была именно там, где нам нужно. Счастливых праздников!

Эта статья изначально была опубликована на Medium

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *