Семантическая сеть: где она сейчас?
При всем волнении вокруг Deep Learning и Blockchain легко упустить перспективы других «поддерживающих технологий», особенно тех, которые игнорируются или забыты промышленностью из-за того, что они слишком академичны или нишевы. Gartner ранее в этом году опубликовала свой Цикл ажиотажа для новых технологий 2018 г.а буквально пару месяцев назад Тим Бернерс-Ли объявил о своем мировой план децентрализации Интернета.
Это может быть не сразу очевидно, но обе эти истории имеют одну общую черту: Семантическая паутина.
Оба графы знаний (из отчета Gartner) и RDF (из упомянутого плана мирового господства Солидный проект) являются неотъемлемой частью видения Semantic Web и стек технологий. Вот почему эксперты не согласны с тем, что любая часть этого все еще является шумихой или что он на самом деле «мертв», потому что, хотя окончательное видение, возможно, еще не материализовалось, его побочные продукты все еще в значительной степени действуют.
Даже идея веб-децентрализации, возможно, тихо зарождалась в принципы связанных данныхкоторый можно рассматривать как идеологическую основу для RDF.
Сейчас мы приближаемся к концу 2018 года и вступаем в то, что, возможно, может стать годом Web 4.0. Возможно, настало время сделать один маленький шаг назад для Интернета и взглянуть на то, каким было все это время его грандиозное видение. Мы будем лениво полагаться на графики циклов ажиотажа Gartner (каламбур) на протяжении многих лет, прошедших с момента создания концепции, в сочетании с моими личными академическими исследованиями и опытом применения в отрасли, а также большим количеством мудрости, почерпнутой из самой сети, чтобы представить краткий обзор не Краткая история Semantic Web.
Вовремя т=0 у нас есть известное объявление TBL о его видении интеллектуальной сети в Статья в журнале Scientific American 2001 г..
Популярная цитата из «Семантической паутины» Бернерса-Ли, Хендлера и Лассилы, воспроизведенная
В том же году Gartner своевременно ввел термин Семантическая сеть в качестве новой записи в своем отчете о новых технологиях, предсказывая, что через 5–10 лет он станет промышленно продуктивным. Как и многие технологические вехи, основы уже существовали в то время благодаря многолетним исследованиям в области символический искусственный интеллект (по сравнению с сегодняшним вероятностным ИИ), что дало нам экспертные системы а также базы знаний 80-х годов.
Gartner Hype Cycle for Emerging Technologies 2001, любезно предоставлено
Помимо XML, был разработан абстрактный язык моделирования данных RDF. указано в 1999 г. (это почти 20 лет на сегодняшний день). представление знаний и рассуждения (KRR) специализация ИИ создала прецедент для описание онтологий (думаю, интеллектуальная схема), с простым РДФ-С и продвинутый СОВА Языки онтологии были введены примерно в то же время.
Инструменты, такие как Протеже, Сезам OpenRDF и лаборатория HP Йена уже находились в разработке или использовались в качестве исследовательских возможностей, особенно в биоинформатика.
Gartner Hype Cycle for Emerging Technologies 2006, любезно предоставлено
Набирая обороты примерно через 4–5 лет, мы видим упоминание о Корпоративная семантическая сеть в 2005 и 2006 годах. Это как раз то время, когда язык запросов RDF СПАРКЛ и язык процессуальных правил SWRL (дополняющие декларативные правила OWL).
Базы данных графов RDF или тройные магазины например реклама Франца АллегроГраф а также Кингсли Юи Идеэнс открытым исходным кодом Виртуоз подходили к месту происшествия. Дэйв Беккетключевой игрок в этой области, уже зарекомендовал себя C RDF-библиотеки и разработчики были используя их интересным образом.
Хотя для этого нет отчета Gartner, период с 2006 по 2010 год знаменует собой самое захватывающее время для семантических (веб-технологий). Пик завышенных ожиданий видения, быть может?
Freebase была в полном разгаре, и позже она была приобретена Google и стала основой для ее собственной проприетарной базы данных. График знаний. SPARQL v1.1, OWL v2 и ВРАЩЕНИЕ были введены для обеспечения столь необходимой гибкости запросов RDF, онтологической аналитики и возможностей рассуждений.
За эти годы также были опубликованы три важные книги в этой области: моя любимая Основы семантических веб-технологий, Семантическая сеть для работающего онтологаа также Программирование семантической сети (один из немногих, использующих Python, в то время, когда в этой области доминировала в основном Java и до сих пор).
Университеты также включали ключевые темы в свои программы на получение степени, а профессиональные институты начали предлагать сертификаты. Иными словами, относительно многое происходило относительно, и это отражалось на деятельности как научных кругов, так и промышленности.
Gartner Hype Cycle for Big Data 2012, любезно предоставлено и Gartner Hype Cycle for Advanced Analytics and Data Science 2015, воспроизведенный
События после 2010 года — это совсем другая история, и в ней есть некоторое разочарование. Программные инструменты были заброшены, стартапы замолчали, а организации перестали публиковать (мета)данные RDF в пользу JSON. Идея Semantic Web начала получать какая-то ненавистькак ни странно, от непосредственных участников сообщества, таких как Ману оспаривается.
Gartner на правильном месте Семантическая сеть приближается к корыто разочарования в 2012 году возможное неизбежное падение, подтвержденное Связанные данные находясь на дне корыта в 2015 году.
Однако кое-что хорошее из этого вышло: мультиотраслевая schema.org проект словаря для встраиваемых метаданных (то, что вы знаете как расширенные фрагменты или же семантическое SEO), РДФ сериализация (или альтернатива, если это ваша позиция) JSON-LDпо-настоящему совместимый с OWL2 тройной магазин Стардоги книга Изучение SPARQL (Боб Дюшармх совсем блоггеркстати).
Gartner Hype Cycle for Emerging Technologies 2016, любезно предоставлено и Gartner Hype Cycle for Emerging Technologies 2018, первоисточник
Практичность семантической паутины до сих пор пользуется плохой репутацией, поскольку депрессивная ситуация из-за крутой кривой обучения. Ничто не может быть дальше от истины — RDF чертовски прост, особенно в его Форма черепахи. Любое нетривиальное приложение, независимо от технологии, требует обучения.
Последние несколько лет разочарования, похоже, породили широко распространенные заблуждения и непонимание, но не все потеряно.
Некоторые инструменты и библиотеки, возможно, устарели, но те, которые доказали свою эффективность, продолжают жить. кунжут стал RDF4J, проект Eclipse. Тройное отображение объекта в Java (OTM; подумайте ОРМ для RDF) фреймворков Али Баба (ранее Элмо) и Империя хотя и в меньшей степени, но все еще активны или, по крайней мере, функциональны. питон а также JavaScript тоже не остались в стороне.
Многие организации, возможно, отказались от публикации XML и RDF, но те, для кого данные имеют высокий приоритет, также отдают предпочтение этим стандартам. Европейский союз (ЕС) является большим и сложным многопартийным руководящим органом, и это очевидно из недавние инициативы что они успешно используют такие технологии.
С помощью экспертов и сообщества TopQuadrant превратил SPIN в SHACLкоторый должен сзаменить систему декларативных правил OWL и (отсутствие) проверки данных. Проблема семантических данных в масштабе также получила возможное решение в виде Связанные фрагменты данных.
Даже графовые базы данных альтернативный вид сжиженного нефтяного газа относитесь к RDF как к первоклассному гражданину и обещайте предоставить нам семантику, в которой мы нуждаемся, без сложностей или недостатков декларативных языков и логики описания, таких как монотонность и предположение об открытом мире.
Итак, это все? Не в списке. Модные технологии последних двух лет, часто поддерживаемые стартап-программами и средствами массовой информации, сегодня довольно актуальны. дополнение к семантической сети. Машинное обучение — полезный метод для предоставление вероятностных данных для рассуждений и выводови децентрализованная система учета может принести пользу связанным данным, или наоборот.
TL;DR: Semantic Web — идеальная, а не убийственная технология сама по себе. Также нет одного приложения-убийцы, но есть много прошлых, настоящих и будущих инноваций. Он существует благодаря стандартам и технологиям, которые являются кульминацией различных целенаправленных инициатив. Другими словами, в 2018 году семантическая сеть была именно там, где нам нужно. Счастливых праздников!