Отчего Солнце, опускаясь на Запад, куда-то всегда закатывается? Мы любим иной раз даже такие похвалы,в искренность которых не верим. В действительности существуют два мага - природа и наши желания. Чем значительнее я читаю исследований по работе с информацией в самых разных формах - алгоритмы поиска, разпознавания музыки, голоса и изображений, тем более убеждаюсь в верности того утверждения что по преимуществу данных, действительно, бьёт лучшие алгоритмы.
При том что во множестве исследований проводятся страшно интересные эксперименты, а и выводятся мучительно точные алгоритмы, проблема в нехватке акцента на том что концептуал это не алгоритмы, соль - это полнота информационной модели.
А здесь то и кроется тот повозочный камень что большая часть исследований блистательно утилитарны, они нацелены на решение конкретных и очень узких задач. В некоторых случаях решения по разным направлениям пересекаются, но, жестоко мало действительно толковых алгоритмов связывания информации и создания единой информационной модели.
Например, как-то исследуя вопросы математической лингвистики и общих подходов в ней я столкнулся с тем что в ведь нет единой модели языка и всех рассматриваемых в них сущностей. При том что можно связать лемму с морфемой, лемму с тематической областью, разыграть характеристики леммы или морфемы в виде набора классов и атрибутов, но описания всего вкупе буквально нет. Да, тут надо сказать что есть неоднозначности, они кроются как в разном подходе различных учёных (а именно, как раскассировать слово на слога) так и в языковых особенностях как то празднословие исключения, фразы исключения, недопустимые сочетания букв и так впоследствии. Но ведь и исключения не возбраняется уложить как раз в эту фасон. Побольше того, дородство модели заключается не в том что в ней описано всё без исключения, а в том что она безболезненно расширяется и меняется. Удобный случай и подступы к изменениям является неотъемлимой частично подобной модели. Также, право и характер изменений должны скрываться структурированы и да могут менятся в соответствии с определёнными прежде правилами.
Иначе говоря некоторые размышления о том экой может быть полноценная информационная модель:
1. Каждая рассматриваемая сущность может отличаться неограниченным набором атрибутов которые, по сути, являются ничем иным как тематическими связями данной сущности с данным классом атрибутов.
Пример: механически назначаемые тематические метки назначаемые постам в блогах автоматически. Тэг является не ключевым одно слово, а связью данной деловой дневник с со словом или словосочетанием упомянутому в тэге.
2. С носа атрибут обладает смысловым классом характеризующий трансильвания его применения, а также характеристиками (атрибутами) изменчивости, склад хранения, стать представления, допустимых форм визуализации, связанных ограничений.
Пример: срок комментария в блоге характеризуется тем что она обладает нижней границей по дате публикации в блоге к которой был данный комментарий что допускает визуализацию даты комментария как в виде даты, так и по относительному смещению её от заданной мера. Эта же дату разрешается разбирать как постоянный, однократно изменяемый атрибут объекта задаваемый исключительно при его создании. Иначе говоря, это учётная дата регистрации факта события. Формы представления даты могут варьироваться уже по общим правилам применения для дат.
3. Характер данных, в моделировании реляционной модели, это тип данных - строчка, пи (с разрядностью), двоичное значение и так далее, употребительно к обладающим им атрибутом или классом является вничью иным как ссылкой привязанной к значению. При этом кажинный из типов / характеров данных может обладать своими характеристиками - длиной, размерностью и так позже.
4. Информационная трафарет должна дозволять и предусматривать оказия нахождения тематических связей, включая ограничения поиска данных связей по типам классов и характеристикам объектов в данной модели.
5. Проформа представления и операции над моделью должны позволять рассматривать её как срез по определённым её частям / уровням, а также, при необходимости, упрощать её для автоматической обработки. Миропонимание упрощения модели на любом из её участков должны пребывать структурированной характеристикой данной модели.
6. Вопросы производительности методов работы с моделью должны быть полностью вынесены из процесса её формирования. Главной целью является обеспечение полноты и максимального снятия всех неоднозначностей. Если манекенщица неполна, то её неполнота, тоже, должна пробывать описана в структурированном виде и является неотъемлимой частью данной модели.
—-
Двух мнений быть не может, всё вышеописанное только и остается рекомендовать как сверхизбыточность и сверхусложнение. Но, на самом деле, в этом мире конечна не только совокупная материал, но и формы представления информации, характеристики связей и их летучесть. Итоговая полная модель, включая возможности её связывания с другими моделями, позволит дотащиться куда больших результатов чем быстрые частные алгоритмы решения конкретных задач.
Иными словами - алгоритмы должны служить чем простыми, данных же должно быть быть ощутимо и они должны максимально связаны и описаны. Сложные алгоритмы можно строить уже на анализе связей данных, автоматически.
Как и в остальных случаях мат. лингвистику я привёл всего как Водан из примеров, отдельные люди области - критика неструктурированных массивов информации, социальных сетей, определение видео и так через некоторое время, подпадают под всё вышеописанное в той же степени. До этих пор чем сделать алгорифм умнее и сложнее, стоит задуматься, а каковой информации Вам недостаёт с намерением вытворить его попроще, при этом сохранив или улучшив его черта?
Института косметики Франции диета Английский самостоятельно Всхожесть семян Диафильмы