Сайт о телевидении

Сайт о телевидении

» » Чем отличаются данные от знаний. Данные, информация и знания

Чем отличаются данные от знаний. Данные, информация и знания

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

Данные и знания. Основные определения.

Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают.

Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу. Машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее. В языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом.

Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу.

По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации. В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. В системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний.



Отличия между данными и знаниями:

1. внутренняя интерпретируемость знаний (например: данные – 243849..., знания – предложения естественного языка).

2. активность знаний. Если есть знания, то появления новых знаний может привести к изменению старых знаний и появлению новых.

3. связность знаний. Знания не интересны сами по себе, они интересны в совокупности (система знаний).

4. знания динамичны, а данные как правило статичны.

Интенсиональные знания определяются через понятие более высокого уровня с указанием специфических свойств. Экстенсиональные знания определяются через понятия более низкого уровня, обычно путем их простого перечисления. Как правило экстенсионалы хранятся в базах данных, а интенсионалы в базах знаний. Знания по способу представления различают на декларативные (описывается информация) и процедуральные (записаны в алгоритме). Основное направление движения в области представления знаний – большее использование декларативных знаний.

Классификации знаний и их моделей

Существует много способов классифицировать знания. Остановимся на классификации по носителю знаний. Знания делятся на:

1. Формализованные

· справочные руководства,

· энциклопедии,

· знания в корпоративных информационных системах

2. Персональные

· навыки, связанные с ремеслом,

· спортивные навыки,

· способы мышления, анализа,

· способы выполнения работ

Формализованные знания обычно уже размещены на материальных носителях - книги, брошюры, сайты интернет/интранет, файлы данных, КИС (ERP). Эти способы организации знаний очень хороши и проверены временем. Мы вряд ли сможем их существенно улучшить, чтобы это отразилось на производительности или других экономических показателях вашей организации.

Персональные знания, напротив, обычно содержатся только в умах их носителей. Для того, чтобы сделать их достоянием организации, необходимо, чтобы знания активно передавались между сотрудниками. Для этого издавна существует наставничество, системы внутреннего корпоративного обучения.

Очень многие из персональных знаний могут быть формализованы. Это касается прежде всего методов и способов выполнения работ, принятых и оптимальных в вашей организации. В зависимости от этапа развития организации, методы выполнения работ развиваются от творческих, созданных на рабочих местах методом проб и ошибок до лучших практик в индустрии, закрепленных в документации о бизнес-процессе, ERP-системе и в политике организации.

Определения фрейма. Фрейм как список свойств и как сеть. Иерархия и наследование свойств

Фрейм – это некоторая структура представления знаний, которая при ее заполнении соответствующими значениями превращается в описание конкретного фактора, события или ситуации. Фрейм - это минимальное возможное описание сущности какого-либо явления, события, ситуации, процесса или объекта. Минимальность означает, что при дальнейшем упрощении описания теряется его полнота, она перестает определять ту единицу знаний, для которой предназначено. Фрейм имеет определенную структуру, состоящую из множества элементов – слотов. Каждый слот в свою очередь, представляется определенной структурой данных, процедурой, или может быть связан с другим фреймом. Структуру фрейма можно представить так:

ИМЯ ФРЕЙМА: (имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота), … (имя N-го слота: значение N-гo слота).

Ту же запись представим в виде таблицы, дополнив двумя столбцами.

В качестве значения слота может выступать имя другого фрейма; так образуют сети фреймов, состоящие из выделенных вершин и связей. Верхний уровень фрейма представляет соответствующие понятия, а последующие уровни терминальные слоты, которые содержат конкретные значения. Иерархия объектов реализуется через аппарат исследования свойств, когда классы объектов определенного уровня наследуют строения классов фреймов более высокого уровня. Если объект, кот. описывается некоторой группой фреймов находится в концептуальной связи с верхним и нижним уровнями фреймов, то соотв. ему фреймы конструируются с учетом и иерархических отношений и при этом наследование свойств осущ. через слоты или фреймы с одинаковым именем.

1. В чем отличие знаний от данных.

Информация (данные) явл-ся неотъемлемой частью материального мира, характериз-его его упорядоченность или структуру в мире, обусловлена их способностью распознавать стр-ру окружающего мира и использовать рез-т распознавания (знаний о мире). Знания – это информация, воспринятая из внешнего мира. Знание субъективно. Знание уникально, и обмен знаниями м/у индивидами не происходит без потерь, в отличие от данных, в кот. закодирована информация и кот. м. передаваться без потерь. Знание передается посредством к-л метода представления знаний, типичным естественным языком.

Отличаются:

Знания более структурированы;

В знаниях наибольшее зн-ие имеют не атомарные эл-ты знаний, а взаимосвязи м/у ними;

Знания более самоинтерпритируемые, чем данные, т.е. в знаниях содержится информация о том, как их использовать;

Знания активны, в отличие от пассивных данных, т.е. м. порождать действия системы, использующей их.

2. Каковы два основных направления исследований в ИИ

1. Нейронные сети.

Идея. «Единственный объект, способный мыслить – это человеческий мир»; 10 21 нейронов в мозгу, кот. связаны м/у собой. Розенблед, Мак-Каллок – 1936 – 1965 модель percepton

Модель перцетона:

каж. точка предыдущего слоя связана со всеми точками данного слоя

1 слой 2 слой

Распределенная ВС. Индексирование БД. Это синтаксические системы, основанные на формальном подходе. (Модель нервных цепей).

2. Семантические модели.

Идея. Противоположная нейронной идеологии: «не имеет зн-ия, как устроено вычислительное устройство, главное чтобы на заданные входные действия оно реагировало как чел. мозг » - концепция «черного ящика».

Тезис Тьюринга, кот. определил семантический подход (ф-ии мозга).

Языки: Lisp, Fortran.

3. Приведите примеры нечетких знаний.

а)

Молодой б) Пусть S – множество людей. Пусть «высокий» - нечетное подмножество S, кот. ответит на вопрос: «какой человек X явл-ся высоким?». Каж. человеку из области наследования нужно назначить степень принадлежности к нечетному подмножеству «высокий». Для этого используем ф-ию принадлежности, основанную на росте человека:

0, если рост(х)<5 футов;

Высокий(х)= (рост(х) – 5ft)/2ft, если 5 футов<= рост(х) <=7 футов;

1, если рост(х) > 7 футов.

Графически:

4. Приведите пример, характеризующий поверхностные и глубинные знания.

Поверхностные знания:

Я знаю, что на авиазаводе в цехе собирают самолеты;

Y = a 0 x 0 + a 1 (x 0 *2) + a 2 (x 0 *3) + . . .

Глубинные знания:

Я знаю как, с помощью чего собирается самолет;


5. В чем отличие процедурных знаний от декларированных? Приведите примеры.

Процедурные знания – хранят информацию о том, как надо действовать, чтобы получить нужный результат. Декларированные знания – хранят в себе информацию о том, над чем надо выполнить эти действия.

Чтобы собрать самолет необходимо скрепить его основные части (проц. знания), для его сбора необходимы крылья, носовая часть, хвостовая и т.п. и их нужно соединить (декларир. знания).

Различие между декларативным и процедурным предпочтением в том, что последнее определяет не только логические связи между головой предложения и целями в его теле, но еще и порядок в котором эти цели обрабатываются.

6. Охарактеризуйте морфологический, синтаксический, семантический и прагматический анализы в естественных языковых интерфейсах.

a) Морфологический анализ – анализ слова в предложении.

b) Семантический анализ – распознавание смысла в составных частях предложения на основе некоторой предметно - ориентированной БЗ.

c) Синтаксический анализ – анализ распознавания структуры предложения.

d) Прагматический анализ – анализ смысла предложения в реальном контексте на основе собственной БЗ.

7. В чем разница интенсионала и экстенсионала. Пример.

Интенсионал – способствует связи с выделением закономерностей.

Экстенсионал – способ перечисления фактографических сторон (описание на уровне данных)

Пр. : объект (философия): 1. Высокий уровень

2. Примитивный

8. Построить фрейм для следующего примера: “Пингвин и синица- птицы, однако пингвин не умеет летать, о умеет плавать и живет в Антарктиде”.


Для людей, что хотят постоянно совершенствоваться, чему-то обучаться и постоянно изучать что-то новое, мы специально сделали эту категорию. В ней исключительно образовательный, полезный контент, который, безусловно, придется Вам по вкусу. Большое количество видео, пожалуй, могут посоревноваться даже с образованием, которое нам дают в школе, в колледже или университете. Самым большим достоинством обучающих видео является то, что они стараются давать самую свежую, самую актуальную информацию. Мир вокруг нас в эру технологий постоянно меняется, и печатные обучающие издания просто не успевают выдавать свежую информацию.


Среди роликов также можно найти и обучающие видео для детей дошкольного возраста. Там Вашего ребенка обучат буквам, цифрам, счету, чтению и т.д. Согласитесь, очень даже неплохая альтернатива мультикам. Для учеников начальных классов также можно найти обучения английскому языку, помощь в изучении школьных предметов. Для более старших учеников созданы обучающие ролики, которые помогут подготовиться к контрольным, к экзаменам либо же просто углубить свои познания в каком-то определенном предмете. Приобретенные знания могут качественным образом сказаться на их умственном потенциале, а также Вас порадовать отличными оценками.


Для молодых людей, что уже окончили школу, учатся или не учатся в университете, есть множество увлекательных образовательных видео. Они им могут помочь в углублении знаний по профессии, на которую учатся. Или же получить профессию, например программиста, веб-дизайнера, SEO-оптимизатора и прочее. Таким профессия пока в университетах не учат, поэтому специалистом в этой продвинутой и актуальной сфере можно стать только занимаясь самообразованием, в чем мы и стараемся помочь, собирая самые полезные ролики.


Для взрослых людей эта тема тоже актуальна, так как очень часто бывает, что проработав по профессии годы, приходит понимание, что это не твое и хочется освоить что-то более подходящее для себя и одновременно прибыльное. Также среди данной категории людей часто становятся ролики по типу самосовершенствования, экономии времени и денег, оптимизации своей жизни, в которых они находят способы жить гораздо качественнее и счастливее. Еще для взрослых людей очень хорошо подойдет тема создания и развития собственного бизнеса.


Также среди образовательных роликов есть видео с общей направленностью, которые подойдут для практически любого возраста, в них можно узнать о том, как зарождалась жизнь, какие теории эволюции существуют, факты из истории и т.д. Они отлично расширяют кругозор человека, делают его гораздо более эрудированным и приятным интеллектуальным собеседником. Такие познавательные видео, действительно, полезно смотреть всем без исключения, так как знание – это сила. Желаем Вам приятного и полезного просмотра!


В наше время просто необходимо быть, что называется «на волне». Имеется в виду не только новости, но и развитие собственного ума. Если Вы хотите развиваться, познавать мир, быть востребованным в обществе и интересным, то этот раздел именно для Вас.

Все знают, что такое базы данных и как ими пользоваться. Созданы и постоянно расширяются самые разнообразные базы данных по любой тематике, от научной периодики до художественной литературы, от произведений искусства до справочников телефонных номеров.

Но это необходимое образование постепенно начинает терять свою былую значимость. Особенно это касается научной периодики. Главная проблема научных баз данных - это их избыточность. Любой запрос, выполненный по ключевым поисковым словам, выдаст столь огромное количество ссылок, что их просмотр становится отдельной работой. При этом многие материалы различаются столь незначительно, что трудно оценить полезность одного из них на фоне другого.

Вариантом выхода из этой ситуации является создание баз знаний или баз решений: систематезированной информации, которая обрабатывается по другим поисковым алгоритмам.

В чём главное отличие баз данных и баз знаний? В базе данных идёт поиск по ключевому слову, условно говоря - это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 - 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей - это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение - что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая - по способам подачи материала (насосы, окунание детали, распыление раствора), третья - по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний - это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.

Теперь немного о минусах этой системы. Базы данных - это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус - базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний - это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс - при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов - до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Небольшой итог. Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.