Дизамбигуация или лишение неоднозначности

  • 2 минут чтения

Дизамбигуация или лишение неоднозначности

Данное слово пришло из английского языка и обозначает «лишение неоднозначности» или «устранение». Понятие представляет собой инструмент программирования в системе алгоритмов, оказывающих влияние на различие в толковании слов которые пользователь вносит в строку поиска.

Принцип дизамбигуации позволяет поисковым системам расширять диапазон релевантности выдаваемой информации. Русскоязычные поисковые службы способны устранять различия в толковании при помощи избавления от омонимии и анализа словоформ. Операции дизамбигуации выполняются с ориентировкой исключительно текстовый контент вокруг ключевой фразы.

Механизм действия

При наборе посетителем запроса «мельхиоровые ложки» алгоритм поиска, отвечающий за многозначность содержания и контекстное окружение, производит исследование. При этом в выдачу не попадет контент вида: «ложки и розетки», «ложки для обуви» или «ложка дегтя в бочке меда».
Другими словами, принцип действия дизамбигуации заключается в том, что система в состоянии отличать овощи от электротехнического оборудования или экономики. Избавляясь от неоднозначности, при выдаче алгоритм поиска освобождает серверную часть поисковой системы от бесполезной и шумовой информации.

Релевантность с использованием одного слова

Более сложным вариантом для поисковой системы оказывается оформление запроса с использованием одного слова. Отсутствие сопутствующего окружения значительно усложняет механизм действия дизамбигуации. В данном случае поисковые службы прибегают к иным способам, ориентирующихся на статистику, отражающую частоту обращений со стороны пользователей с определенным запросом поиска.

Система Google распределяет понятие «вилка» исходя из своих алгоритмов, обозначив при выдаче в верхней строке данные не о кухонных принадлежностях, а информацию о сайтах букмекерских контор, активно применяющих в своем лексиконе термин «букмекерской вилки».

В связи с нарастающим использованием интернета, наиболее востребованными оказываются поисковые службы, что требует наличия опытных специалистов в области математического моделирования и языкознания. Процесс дизамбигуации требует продуманной разработки и оптимального применения механизмов системы.

Требующая комплексного подхода система должна выполнять разметку большого числа лексико-семантических словоформ на особые омонимические кластеры. Обширная научно-исследовательская деятельность в данном секторе требует «обученности» поисковых машин.

По причине их изначальной неосведомленности относительно текстового окружения и с целью повышения эффективности работы лингвисты употребляют доступные методы исследований как в области лексикологии, так и математики. В этом направлении активно используются технологии, применяющиеся при создании англоязычных семантических сетей FrameNet и WordNet.