Меню Рубрики

Информация с точки зрения семантического подхода

Семантический способ измерения информации – это что такое? На чем он базируется? Какие цели преследует и задачи выполняет? Обо всём этом мы и поговорим в рамках данной статьи.

В каких случаях применяется семантический способ измерения информации? Используется сущность информации, интересует содержательная сторона полученного сообщения – вот показания для его применения. Но для начала давайте дадим изъяснение того, что он собой представляет. Следует отметить, что семантический способ измерения информации – это трудно формализованный подход, который до сих пор полностью не сформировался. Используется он для того, чтобы измерять количество смысла в данных, которые были получены. Иными словами, какой объем информации из полученной является необходимым в данном случае. Такой подход используется для определения содержательной стороны получаемых сведений. И если мы говорим про семантический способ измерения информации, используется понятие тезауруса, которое неразрывно связано с рассматриваемой темой. Что же оно собой представляет?

Хочется сделать небольшое введение и дать ответ на один вопрос про семантический способ измерения информации. Кем введен он? Предложил использовать этот метод основатель кибернетики Норберт Винер, но значительное развитие он получил под влиянием нашего соотечественника А. Ю. Шрейдера. Чем же является тезаурус? Это название используется для обозначения совокупности сведений, которые есть у получателя информации. Если соотнести тезаурус с содержанием сообщения, которое поступило, то можно выяснить, насколько оно снизило неопределённость. Хочется исправить одну ошибку, под влияние которой часто попадает большое количество людей. Так, они считают, что семантический способ измерения информации введен Клодом Шенноном. Неизвестно, как именно возникло это заблуждение, но это мнение неверно. Клод Шеннон ввёл статистический способ измерения информации, «наследником» которого и считается семантический.

Графический подход для определения объема смысловой информации в полученном сообщении

Для чего нужно что-то рисовать? Семантический способ измерения информации в информатике использует такую возможность для наглядного предоставления данных о полезности данных в виде легко понимаемых рисунков. Что же это значит на практике? Для пояснения положения дел строят зависимость в виде графика. Если у пользователя отсутствуют знания о сути сообщения, которое было получено (равняется нулю), то объем семантической информации будет равен этому же значению. Можно ли найти оптимальное значение? Да! Так называется тезаурус, где объем семантической информации максимальный. Давайте рассмотрим небольшой пример. Допустим, пользователю поступило сообщение, написанное на незнакомом иностранном языке, или же человек может прочитать, что там написано, но это для него уже не является новостью, поскольку всё это известно. В таких случаях говорят о том, что в сообщении содержится ноль семантической информации.

Историческое развитие

Вероятно, об этом следовало поговорить немного выше, но наверстать упущенное ещё не поздно. Первоначально семантический способ измерения информации введен Ральфом Хартли в 1928 году. Ранее упоминалось, что в качестве основателя часто упоминают Клода Шеннона. Почему же возникла такая путаница? Дело в том, что, хотя семантический способ измерения информации и был введён Ральфом Хартли в 1928 году, обобщили его в 1948 году именно Клод Шеннон и Уоррен Уивер. После этого основоположник кибернетики Норберт Винер сформировал идею тезаурусного метода, которая получила наибольшее признание в виде меры, разработанной Ю. И. Шнейдером. Следует отметить, что для того чтобы разобраться в этом, необходим достаточно высокий уровень знаний.

Результативность

Что же нам даёт тезаурусный метод на практике? Он является реальным подтверждением тезиса о том, что информация обладает таким свойством, как относительность. При этом следует отметить, что она обладает относительной (или же субъективной) ценностью. Для того чтобы можно было объективно оценивать научную информацию, ввели понятие общечеловеческого тезауруса. Его степень изменения и показывает значительность знаний, которые получает человечество. При этом нельзя точно сказать, какой конечный результат (или же промежуточный) можно будет получить от информации. Возьмём, к примеру, компьютеры. Вычислительная техника создавалась на основе ламповой технологии и битового состояния каждого структурного элемента и первоначально использовалась для осуществления расчетов. Сейчас же почти у каждого человека есть что-то, что работает на основании данной технологии: радио, телефон, компьютер, телевизор, ноутбук. Даже современные холодильники, плиты и умывальники содержат в себе немного электроники, в основе работы которой лежит информация об облегчении использования человеком данных бытовых устройств.

Научный подход

Где же изучается семантический способ измерения информации? Информатика – вот та наука, которая занимается различными аспектами этого вопроса. В чём же заключается особенность? В основу способа положено использование системы «истина/ложь», или же битовая система «единица/ноль». Когда поступает определённая информация, то она разбивается на отдельные блоки, которые именуются подобно единицам речи: слова, слоги и тому подобное. Каждый блок получает определённое значение. Давайте рассмотрим небольшой пример. Рядом стоят два друга. Один обращается ко второму со словами: «Завтра у нас выходной». Когда дни для отдыха – знает каждый. Поэтому ценность этой информации нулевая. Но если второй скажет, что он завтра работает, то для первого это будет неожиданность. Ведь в таком случае может оказаться, что будут нарушены планы, которые строил один человек, например, сходить поиграть в боулинг или же покопаться в мастерской. Каждую часть описанного примера можно описать с помощью единиц и нулей.

Оперирование понятиями

Но что же используется ещё, кроме тезауруса? Что ещё нужно знать, чтобы понимать семантический способ измерения информации? Основные понятия, которые дополнительно можно изучить ещё, – это знаковые системы. Под ними понимают средства выражения смысла, вроде правил интерпретации знаков или же их сочетаний. Давайте рассмотрим ещё один пример из информатики. Компьютеры оперируют условными нулями и единицами. По сути, это низкое и высокое напряжение, которое подаётся на компоненты техники. Причем передают они эти единицы и нули без конца и края. Как же делать различие между ними технике? Ответ на это был найден – прерывания. Когда передаётся эта же самая информация, то получаются различные блоки вроде слов, словосочетаний и отдельных значений. В устной человеческой речи для разбивки данных на отдельные блоки тоже используются паузы. Они настолько незаметны, что большинство из них мы замечаем на «автомате». В письме для этой цели служат точки и запятые.

Особенности

Давайте затронем ещё и тему свойств, которые есть у семантического способа измерения информации. Мы уже знаем, что так называется специальный подход, которые оценивает важность информации. Можно ли говорить, что данные, которые будут оцениваться таким способом, будут объективными? Нет, это не верно. Информация является субъективной. Давайте рассмотрим это на примере школы. Есть отличник, который идёт впереди утверждённой программы, и среднестатистический середнячок, который изучает то, что излагается на занятиях. Для первого большинство информации, которую он будет получать в школе, будет представлять достаточно слабый интерес, поскольку он это уже знает и не впервые слышит/читает. Поэтому на субъективном уровне для него это будет не очень ценно (за счёт разве что отдельных замечаний учителя, которые он подметил за время изложения своего предмета). Тогда как середнячок о новой информации что-то слыхал только отдаленно, поэтому для него ценность данных, которые будут излагаться на уроках, на порядок больше.

Заключение

Следует отметить, что в информатике семантический способ измерений информации – это не единственный вариант, в рамках которого можно решать имеющиеся задачи. Выбор должен зависеть от поставленных целей и присутствующих возможностей. Поэтому, если тема заинтересовала или же в ней существует потребность, то можно только настоятельно порекомендовать изучить её более подробно и узнать, какие ещё способы измерения информации, кроме семантического, существуют.

Семантический подход к измерению информации

Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.

В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность(учитывают прагматику информации) и истинностьинформации (учитывает семантику информации).

Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле:

где p1, p2 – вероятности достижения цели после и до получения сообщения, соответственно.

Пример 1. Пусть вероятность p2 сдачи экзамена по информатике до получения сообщения (подсказки от соседа) оценивается студентом со значением 0,2. После того, как ему удалось получить подсказку, вероятность сдачи увеличилась: p1 = 0,8. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

В соответствии с приведенной формулой имеем: I = log2(0,8/0,2) = log24 = 2.

Пример 2. Пусть положение студента до получения подсказки оценивается аналогично предыдущему примеру. После получения подсказки, вопреки ожиданиям, вероятность сдачи еще уменьшилась, поскольку подсказка содержала неверную информацию: p1 = 0,1. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

В соответствии с приведенной формулой имеем: I = log2(0,1/0,2) = log20,5 = -1.

Таким образом, полученная информация является дезинформацией, поскольку имеет отрицательный знак при измерении.

Количество усваиваемой потребителем информации Iусв тесно связано с теми знаниями, которые имеет потребитель к моменту получения информации – с тезаурусом (ТЗ) потребителя. Этим определяется полезность информации. В самом деле, для усвоения тех знаний, которые получаются в ВУЗе, требуется среднее образование — иначе студент ничего не поймет. С другой стороны, любая учебная дисциплина ориентируется на знания, которые учащийся должен приобрести в предыдущих курсах. Этим объясняется последовательность учебных дисциплин по годам обучения.

Зависимость усваиваемой потребителем информации от его тезауруса выражается графически следующей кривой:

Как видно из графика, при тезаурусе, равном нулю и максимальному значению в точке max, информация не усваивается: в первом случае, потребителю непонятна принимаемая информация, во втором – она ему уже известна. Максимально усваивается информация (т.е. она наиболее полезна) в точке opt, когда потребитель обладает достаточным (но не максимально возможным) тезаурусом для понимания получаемой информации. При значении тезауруса i-го потребителя ТЗi количество усваиваемой им информации определяется как Iусв = f(ТЗi). Сам тезаурус ТЗi может быть практически определен как результат интеллектуального тестирования, которое проводится, например, в некоторых западных странах. При таком тестировании человеку выставляется некоторый балл, который и может расцениваться как его ТЗi.

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: На стипендию можно купить что-нибудь, но не больше. 8158 — | 6643 — или читать все.

Семантическое сжатие. Передача информации с точки зрения КТПП

Сжатие в основном имеет две основных области применения – хранение и передача информации. Причем применение сжатия обусловлено в основном экономическими соображениями рационального использования ресурсов. Но цель сжатия — хранить и передавать не конкретные символы/пиксели, а ту смысловую информацию, которую они описывают. А ее конкретное представление (символы/пиксели) обусловлено текущей технологией.

Рассмотрим следующую аналогию. Раньше деньги прочно ассоциировались с золотом, драгоценностями. И путешественники возили с собой кошельки, туго набитые монетами, что было нелегко и опасно. Потом люди придумали чеки и банкноты – то есть драгоценности хранятся спокойно в сейфе в банке, а человек носит с собой ссылку на этот запас в виде денежной купюры. Сейчас дело пошло еще дальше, и мы храним уже даже не деньги, (как ссылку на богатство), а ссылку на эти деньги – информацию о деньгах на кредитной карте.

Читайте также:  Что надо сделать чтобы сохранить зрение

Так вот, образно говоря об информации, мы сейчас таскаем всю свою наличность с собой. А почему нельзя передавать просто чеки? Ведь в словах «горел закат» содержится столько же информации, сколько в многомегабайтном tiff овском файле с фотографией этого заката. И если нам нужна просто информация о закате – зачем таскать весь файл?

Исходя из этого, предлагается новый способ представления информации, когда сама структура информации хранится отдельно, в некоем банке данных, а собственно информация – как комбинация понятий представленная ссылками на описания понятий в этом самом банке данных.

Поскольку пространство понятий едино для окружающего мира, то для передачи информации достаточно передавать идентификаторы объектов — понятий в ПП, а не их описание в традиционных языках. (опять аллюзия к растровому и векторному способу хранения изображений), что позволит управлять избыточностью информационного потока.

В Существующих алгоритмах архивации их авторы интуитивным путем выделяют области пространства понятий (словари) и записывают кодируемую информацию в терминах пространства понятий. Следовательно, существует взаимосвязь между алгоритмами сжатия и механизмом ПП, еще не описанная математически.

Введем понятие «плотность информации», как величину, обратную избыточности информации.

Пл_инф=1/Кизб. (Кизб — коэффициент избыточности информации, по Шеннону- Колмогорову)

Плотность информации характеризует соотношение количества информации ( по определению информации из теоремы о сложности Колмогорова) и хранимого объема информации. И, в соответствии с тем, что избыточность информации не может быть больше единицы, то и ее плотность всегда будет меньше единицы ( реальное количество информации не больше всего объема хранимой информации).

Пл__инф- это комплексная величина, ее составляющие — плотности, зависящие от различных способов хранения информации. Так, для текстовой информации это будут грамматическая, синтаксическая и лексическая избыточность хранимой информации. В общем же случае можно выделить Пл_код плотность кодирования (включает в себя грамматическую плотность и частично-синтаксическую) и Пл_сем — семантическую плотность ( лексическая и опять же частично синтаксическая) хранимого объема информации, причем,

Пл_инф=Пл_код х Пл_сем = (1/Кизб_код)х(1/кизб_сем) = 1(Кизб_код х Кизб_сем),

Кизб_код и Кизб_сем — коэффициенты, характеризующие избыточность, возникающую при кодировании информации и семантическую избыточность..

Современные алгоритмы сжатия, как правило, уменьшают только избыточность кодирования, а семантическая же избыточность ими игнорируется, так как, как правило, эти алгоритмы работают с входным потоком символов, что соответственно, снижает эффективность сжатия. Частично Семантическая избыточность уменьшается при использовании алгоритмов сжатия с потерей информации, но в этих алгоритмах данный процесс носит неуправляемый характер, в силу примитивности (линейности) работы таких алгоритмов (Jpeg, Mpeg).

Поскольку эти алгоритмы используют достаточно простые методы интерполяции, они выкидывают «лишнюю» информацию без точной оценки ее значимости. Так, при сжатии изображений с использованием jpeg, оценка качества сжатого изображения происходит, как правило «на глазок». То есть, если стоит задача съемки панорамного изображения и быстрой его передачи, почти гарантированно не будут точно переданы мелкие элементы изображения, хотя в некоторых случаях, эта информация может оказаться ключевой ( например, для военных систем с дистанционным управлением — «маленькие точки» могу оказаться силами противника).

Другой пример: в силу структуры языка, в текстовых информационных массивах много дублирующейся информации, которую достаточно передать один раз или варьирующейся, для описания изменения в которой не нужно полностью перекачивать весь массив заново, а достаточно передать только изменения. Современные алгоритмы сжатия не распознают такие повторения, так как в них принимается вероятностный подход к появлению конкретных цепочек символов. Путь к решению этой проблемы показан в семействе алгоритмов Зива-Лемпела, (кодирование повторяющихся слов), но данный алгоритм совершенно не устойчив к незначительным изменениям входного потока — при появлении нового, возможно случайного и незначимого символа, он начинает кодировать блок заново.

Для исправления этих недостатков, с позиций Теории Пространства Понятий предлагается другой подход — сначала получить всю возможную информацию путем отражения информационного массива в пространство понятий, для поиска координат понятий, описанных в данном информационном массиве в пространстве понятий. Затем передать уже координаты областей пространства, куда попадает информация из этого массива, соответственно передавая значимые и отбрасывая незначимые понятия. То есть получается, что полностью контролируется семантическая избыточность передаваемой информации. А последующее кодирование осуществляется уже проверенными и отработанными методами символьного кодирования.

Слово — это код, обозначающий понятие, причем код неоптимальный. Одним словом могут обозначаться многие понятия (многозначные слова и омонимы) , или же одно понятие может обозначаться несколькими словами языка (синонимы, близкие по значению слова, например дорога и путь) . Причем, если рассматривать «коренные» слова того или иного языка, то в них прослеживаются семантические связи с понятиями, которые они обозначают (бег – бегать, бегун), а для новых, заимствованных слов (компьютер, менеджмент) таких семантических связей нет, что повышает семантическую избыточность данным слов. (см. также 7.9 Создание нового универсального языка)

Сжатие в основном имеет две основных области применения – хранение и передача информации. Причем применение сжатия обусловлено чисто жлобскими соображениями буржуйской экономии.

Хранить и передавать нам надо не конкретные символы/пиксели, а ту смысловую информацию, которую они описывают. А символы/пиксели – это издержки текущей технологи представления информации.

Я предлагаю новый способ представления информации, когда сама структура информации хранится отдельно, в некоем банке данных, а собственно информация – как комбинация понятий представленная ссылками на описания понятий в этом самом банке данных. Мы нашли недавно очень интересную аналогию. Раньше деньги прочно ассоциировались с золотом, драгоценностями. И путешественники возили с собой кошельки, туго набитые монетами, что было нелегко и опасно. Потом люди придумали чеки и банкноты – то есть драгоценности хранятся спокойно в сейфе в банке, а человек носит с собой ссылку на этот запас в виде денежной купюры. Сейчас дело пошло еще дальше и мы храним уже даже не деньги, (как ссылку на богатство) а ссылку на эти деньги – информацию о деньгах на Эл. Карте. )

Так вот, образно говоря об информации, мы сейчас таскаем всю свою наличность с собой. А почему нельзя передавать просто чеки? Ведь в словах «горел закат» содержится столько же информации, сколько в многомегабайтном tiff овском файле с фотографией этого заката. И если нам нужна просто информация о закате – зачем таскать весь файл?

Прикладное и фундаментальное применение теории семантического пространства

Семантическая изотопия: определение понятия, основные точки зрения

Проблема семантической изотопии связана с современным изучением текстовых категорий. Исследования в области текста на современном этапе не имеют единой концепции и терминологии, но все они направлены на то, чтобы изучить то, как выстроен текст и как текстовые элементы подчиняются единому замыслу автора.

Само понятие изотопии ассоциируется с естественнонаучными исследованиями. «Согласно Д. Делу слово изотопия возникает в физике в 1922 году, изотопия смешивается здесь с изотопом, т.к. появляется только в 1933 году. По его мнению, А.-Ж. Греймас переносит понятие изотопия из физики и химии в область семантики. Ф. Растье считает, что изотопия А.-Ж. Греймаса никак не связана с аналогичным понятием в других областях науки. Ее появление вызвано необходимостью отразить еще расплывчатые, но вместе с тем нужные представления о постулируемой в отношении целостности сообщения значения» (Растье 2001, с. 110).

В основе понятия изотопии лежит повторяемость элементов, относящихся к одной и той же категории. В работе А. -Ж. Греймаса «К интерпретации мифологического нарратива» читаем: «Под изотопией мы понимаем избыточную совокупность семантических категорий, которая позволяет единообразное прочтение нарратива путем разрешения многозначности отдельно прочитанных высказываний на основе поисков единообразного прочтения нарратива» или более позднее определение: «Под изотопией обычно понимают пучок избыточных семантических категорий, содержащихся в изучаемом дискурсе» (цит. по Растье 2001, с. 95). То есть изотопия определяется, исходя из повторяемости элементов, принадлежащих одной категории. «Текст предстает в виде знака, дискурсивное членение которого на многочисленные фигуративные изотопии есть ничто иное как означающее, взывающее к разгадке своего означаемого» (Греймас 1985, с. 132).

Ученик А. -Ж. Греймаса Ф. Растье определяет изотопию как итерацию (повторение) любой лингвистической единицы в составе выражения. Что касается плана содержания, то изотопия образуется, по его мнению, повторением всех видов сем, а не только категориальной семы, как у А. — Ж. Греймаса. Ф. Растье подчеркивал, что изотопия может быть установлена только между единицами одного и того же уровня, принадлежащими к одному и тому же типу. Он выделяет родовую и видовую изотопии. Родовая изотопия соответствует изотопии категориальных сем А. -Ж. Греймаса.

Термин изотопия мы встречаем также и в работах лингвистов немецкой школы. Э.Агрикола, рассматривая данную проблему, вводит понятие «топик», под которым понимает «минимум пару семантических единиц, способных заменять друг друга. Несколько топиков образуют топикальную цепочку, которая, проходя через весь текст, обеспечивает его единство. Топикальные цепочки складываются в пучки и создают изотопию текста, то есть развивают его содержание» (Габ 1988, с.32).

Этот же лингвистический феномен упоминает в своей работе З.И. Шмидт, подчеркивая, что с семантической точки зрения текст можно рассматривать как «самостоятельный уровень изотопии» (Шмидт 1977, с. 95). Смысловое единство достигается только в том случае, когда существует преобладающий уровень изотопии, которому подчинен ряд других изотопий, не нарушающий общего замысла. Об установлении иерархических отношений в области изотопий говорят и другие, называя доминирующую изотопию «базовой» (Клинкерберг), «основной» (А. — Ж. Греймас), центральной (Ван Дейк).

О семантической изотопии можно говорить на уровне фразы, сверхфразового единства, абзаца и целого текста. «Семантическая изотопия вбирает в себя такие лингвистические явления, как субституция (В. Дресслер), номинационная цепочка (В.Г. Гак), кросс-референция (В. Палек), анафора (Халлидей), прономинальная деривация (Т. Ван Дейк), семантический повтор (С.И. Гиндин), нанизывание (И.П. Севбо)» (Габ 1988, с. 35).

В отечественной лингвистике изотопия ассоциировалась с такими понятиями как тема, связность, когезия, когерентность, целостность, при определении которых не ограничивались только лингвистическими знаниями, поскольку их недостаточно для рассмотрения такого многоаспектного явления как текст. Поэтому привлекаются знания из психолингвистики, философии, культурологии, семиотики, психологии и других областей гуманитарного знания, объясняющих многие текстовые аспекты.

Категории цельности и связности были и остаются одними из самых дискуссионных в лингвистике текста. Речевая природа текста определяется ритмами человеческого сознания и характеризуется расчлененностью содержания.

С точки зрения грамматического подхода текст понимается как совокупность связанных между собой предложений. Традиционное понимание связности ассоциируется с синтаксической связностью, выделяется цепная и параллельная связи (Солганик 1973). В работах З.И. Хованской семантическая изотопия ассоциируется с «воспроизведением идентичных или близких смысловых компонентов, составляющих основу смысловой связности» и обозначается как «семантическая итеративность» (Хованская 1980). Т.М. Николаева же вводит понятие семантической изотопии для семантически близких элементов у членов цепочки связного текста. Изотопными могут быть все структуры соседних элементов (Николаева 1983).

Читайте также:  Зрение при работе на высоте электриком

И.В. Арнольд использует при описании связности понятие избыточности, введенное Греймасом. Она считает, что избыточность основана на том, что каждый последующий элемент текста может быть предсказан на основе предыдущих благодаря взаимосвязи с ними, а также благодаря наложенным на них ограничениям и тому, что сообщение помимо новых данных, передает и многое, адресату уже известное. Избыточность задерживает внимание читателя на той или иной части сообщения и тем самым способствует более полному восприятию (Арнольд 1990).

К.Э. Штайн отождествляет целостность поэтического текста с его гармонической организацией, понятие изотопии связывает с изотопической симметрией. «Изотопия — система непрерывного отображения семантических блоков (топосов) в тексте, разные части которого характеризуются наличием инвариантного значения» (Штайн 1996, с. 116). Формирование целостности осуществляется в двух направлениях: временном и пространственном. «Временные координаты соответствуют последовательно развертываемому тексту, реализующемуся через линейно связанные синтаксические единицы. Пространственные координаты фиксируют вертикальные связи, образующиеся за счет элементов расслоения поэтического текста» и основанные на отношении эквивалентности (повторе семантических блоков) и дополнительности (отношения взаимоисключения, контраста, противопоставления)» (Штайн 2001, с. 16). Помимо горизонтали и вертикали выделяет глубину текста, зависящую от «культурных языковых слоев, которые активизируются языковыми слоями». Эти три уровня в принципе и организуют глобальную изотопию текста, его гармонию, связность

В результате связей частей текста создается его целостность, являющаяся одной из его характеристик. Такую связь, приводящую к целостности текста, И. Р. Гальперин назвал интеграцией. Он считает, что она нейтрализует авто семантию частей и подчиняет их общему содержанию произведения. Интеграцию он соотносит с понятием когезии. «Когезия — это категория логического плана, а интеграция — скорее психологического. Углубляя данное противопоставление, он отмечает, что если когезия регулируется в синтагматическом разрезе, то интеграция — в парадигматическом. Поэтому можно считать, что когезия — линейна, интеграция — вертикальна» (Гальперин 1983, с. 512). Процесс интеграции, обеспечивая целостность текста, тем самым стремится к его завершенности.

Целостность как фундаментальное свойство текста рассматривается А. А. Леонтьевым. Он считает, что в отличие от связности, которая реализуется на отдельных участках текста, цельность — это свойство текста в целом. «В противоположность связности, цельность есть характеристика текста как смыслового единства, как единой структуры, и определяется на всем тексте. Суть феномена целостности. в иерархической организации планов речевого высказывания, используемых реципиентом при его восприятии» (Леонтьев 1971, с. 29). В качестве плана речевого высказывания выступает тема как коммуникативная единица, отображающая воплощенные содержания текста, необходимые для адекватного понимания текста.

Связность, целостность рассматривается как особый вид смыслопостроения, представляющие собой единство расчлененных компонентов смысла, стремящихся к единству. Соответственно сам текст можно рассматривать как «фиксированный результат, продукт, который самодостаточен и может работать как «генератор смыслов» (Лотман 1970).

Г.И. Богин рассматривал целостность с позиций феноменолого — герменевтического подхода. Целостность — это «сотворение мира», важнейший момент субстанциальности, она осуществляется с помощью рефлексии, которая выделяет каждый раз тот или иной фрагмент целостности, соединяя его с другим фрагментом, приводит к усмотрению общности в этих фрагментах. Рефлексия очень тесно связана со смыслом и пониманием текста. В результате взаимодействия частных и сущностных смыслов формируется феноменологический «жизненный мир», или целостность текста. (Богин 1993). С позиций семантического описания текста о том же говорит М.Я. Дымарский. Целостность текста он обозначает как концептуально значимый смысл, который «включает предметно-фактическую информацию о некоторой ситуации, объединенную не только единством ситуации, но и общностью приписываемого ей модального значения, модальное значение образует оболочку предметно-фактической информации» (Дымарский 2002, с. 63). Концептуально значимый смысл возникает в результате соотнесения содержания и речевых смыслов высказывания фрагмента с актуальной текстовой ситуацией и со всем текстом.

Феноменологическое понимание смыслового единства дополняется когнитивными исследованиями в монографии Н.И. Колодиной. Единая структура текста состоит из структур текстопостроения и смыслообразования, находящихся в тесном единстве и взаимодействии. Когнитивные структуры «мнемо — паттерны» участвуют в образовании единого смысла, который рассматривается как интеграция мыследействия и мыследействования, т. е. включает субъективный опыт реципиента и объективные свойства предмета (Колодина 2001).

Исследование Н.И. Колодиной органически входит в череду психолингвистических исследований текста, направленных на изучение его восприятия и понимания и базирующихся на концепции специфики индивидуального лексикона. Особое внимание пониманию текста уделяется в работах Ю.А. Сорокина. Он подчеркивает, что понятие связности эксплицируется лингвистическими знаниями, а понятие целостности и эмотивности могут быть выявлены только через взаимодействие текста и реципиента в психолингвистике. Особую роль при ориентировке текста обычно играют структурные опоры, функциональная значимость которых формируется у носителей языка по мере переработки его речевого опыта. Например, Сорокин говорит о «совокупности психических и когнитивных образов», «наборов когнитем и эмоционем», на которые ориентируется реципиент текста. (Сорокин 1988, с.2). В качестве таких опор могут выступать ключевые слова, заглавия, сценарии, схемы, фреймы, гештальты. Аспектами когнитивного понимания текстов занимались А.А. Залевская, А.А. Леонтьев, Н.А. Рубакин, А.С. Штерн, Н.В. Рафикова, Филлмор, ван Дейк и др.

Кроме того, в исследованиях учитываются авторская интенция — субъективная сторона текста и экстралингвистические данные, позволяющие учесть знания, имеющиеся у читателя-реципиента. Такие исследования отличаются от предыдущих тем, что имеют направленность на читателя, на его познавательную активность, эксплицирующуюся в когнитивной лингвистике и психологии.

Т.В. Матвеева, анализируя стилистическое разнообразие различных текстов, выделяет «линейные тематические цепочки текста», где происходит формирование тематического каркаса текста, через понятие темы осмысливается связь текста не только с его денотатом, но и с его субъектом (автором). Он переплетается с «цепочкой хода мысли», которая устанавливает тематическую и смысловую иерархию в тексте и получает название информации. Автор выделяет следующие ее типы: «основная, типичная, дополнительная, детализирующая» (Матвеева 1990, с.25). Следовательно, текст состоит из расчлененных однородных элементов (тем), подчиненных авторскому замыслу. В тексте оказывается значимой каждая деталь, стиль, композиция. «Здесь все взаимосвязано, сцементировано, как говорил Л.Н. Толстой, «единством самобытного нравственного отношения автора к предмету», т.е. его собственным неповторимым взглядом на мир, который вносит порядок в хаос. Иначе говоря, художественный текст образует систему, где функция каждого элемента, его значимость определяется всеми остальными» (Долинин 1985, с. 93).

Определение семантической изотопии производится в рамках концепции целостности текста, основывается на знаниях из разных научных областей. Под текстом в работе понимается «единая речевая целостность, взятая в коммуникативном процессе» (Баранов 2002), т.е. текст имеет многослойную и многоуровневую организацию. Текст представляет собой особую речемыслительную форму, которая всегда ориентирована на репрезентацию темы под определенным углом зрения.

В узком понимании изотопия (отдельной конкретной области) рассматривается как семантическая категория, имеющая в своем составе лексические единицы, участвующие в организации текста. В широком понимании, как содержательная единица (тема), отображающая соответствующие смыслы с целью воздействия на реципиента и конструирующая интеллигибельное пространство. Семантическая изотопия строится на принципах избыточности, которая обеспечивает распределение смыслов в речевой цепи за счет наличия итеративных (повторяющихся) сем. Изотопия, репрезентирующая какое-либо языковое явление, является меняющимся моментом свершающегося события, т.е. выступает частью диалогического пространства текста, когда в динамическом взаимодействии находятся сознания персонажей, повествователя, автора и читателя.

Итак, изотопия формируется на основе совокупности семантических единиц, способных образовывать соответствующие смыслы и находиться в постоянном гармоническом единстве с соседними единицами текста. Понятие изотопии тесно связано с развертыванием его тематического пространства, «читать текст, значит, идентифицировать его изотопии, внимательно следить за развитием тем или изотопий.

Семантический подход к определению количества информации

Для определения количества информации при разработке коммуникационных сетей или определении требуемой емкости запоминающих устройств ее измерение в битах и байтах полезно, но, к сожалению, не может быть использовано при оценке информативности, например, управленческих документов. Оценивать литературное произведение или научную статью таким способом вряд ли целесообразно. Хотя в лингвистике есть задачи, для которых методы классической теории информации бывают полезны.

Осознание этого факта привело к развитию так называемой семантической меры информации, т.е. характеристики информации с точки зрения ее смысла и содержания.

Семантика – раздел языкознания, изучающий значения, смысл отдельных единиц языка, слов и оборотов речи, связь между содержанием и знаком в процессе мышления, ее зависимость от прошлого опыта получателя сообщения. Семантический аспект является предметом исследования науки о знаках – семиотики.

Семиотика – наука, исследующая свойства знаков и знаковых систем в человеческом обществе (естественных и искусственных языков) и природе (коммуникации в мире животных). Семиотика изучает знаковую структуру сообщений как абстрактного отображения реальных явлений, а семантика изучает процесс преобразования смысла сообщения в знания.

Для условного обозначения объектов и явлений, данных в ощущениях, человек стал использовать специальные символы, знаки. Смысл знака в том, какую информацию о чем-то другом, непосредственно не связанном с сигналом, он несет. Каждый знак соотносится с другим знаком, образуя знаковую систему. Вне договора (даже с самим собой) знака не существует.

Осознанное использование даже нескольких простых знаков расширяет возможности мозга и способствует его развитию, что в свою очередь обуславливает совершенствование знаков и постепенно приводит к возникновению сложных знаковых систем. И мозг, и используемые системы знаков развиваются «в направлении прогресса обоих слагаемых». На определенном этапе этой эволюции люди начинают выражать общие, абстрактные идеи, не связанные непосредственно с какими-либо ощущениями, что дает им возможность развиться в особое высшее существо. Животные не обладают способностью к абстракции, использованию каких-либо обобщающих знаков [37].

Следствием развития знаковых систем, стало появление языков, «изобретенных» человеком для реализации своих мыслительных способностей.

Все знаки языка тесно связаны между собой, и значение каждого зависит от соотношения других элементов. Существует сложное взаимодействие слов, поддерживающих друг друга. Это позволяет с помощью ограниченного набора средств выразить неограниченное количество смыслов.

Язык можно считать главной, универсальной знаковой системой, так как его появление стало основой развитие человеческой цивилизации и с его помощью можно пересказать, описать содержание большинства других знаковых систем (возможно, кроме музыки и абстрактного искусства).

Многие знаковые системы активно используют естественный язык для расширения своих возможностей: требуются комментарии к математическим выкладкам, необходимо давать названия объектов на географических и других картах, составлять спецификации к техническим чертежам и пр.

Язык – средство информационного отображения, обозначения, кодирования объектов реального мира. Он позволяет охватывать, смоделировать и внешний, и внутренний мир человека, тончайшие нюансы его переживаний.

Читайте также:  Какая строка в таблице зрения на единицу

Язык – средство базовых информационных процессов – мышления и памяти. На нем мы думаем, творим, принимаем решения. Человек начинает себя помнить с возраста, когда достаточно хорошо овладел родным языком.

Язык – главное средство общения, информационных коммуникаций, без которых не смогло бы зародится человеческое общество. Интересно, что все известные к настоящему времени древние племена, на какой бы низкой стадии развития они не находились, имеют свой язык.

Язык – результат многовекового творчества, длительной эволюции. С одной стороны, это живая развивающаяся знаковая система, позволяющая отображать все новейшие образования, а с другой, система достаточно консервативная: практически все модные «уродства и искажения» довольно быстро исчезают и забываются.

Методы точного количественного определения смыслового содержания информации, выраженной с помощью известных знаковых систем, в настоящее время еще не разработаны. Однако можно изложить некоторые рациональные соображения и подходы к решению этой проблемы.

Семантическая мера должна учитывать не только структуру и содержание самого сообщения, взятого изолированно от получателя, но еще и запас знаний получателя, т.е. что нового несет получателю сообщение по сравнению с тем, что он уже знал или предполагал. Информативность сообщения измеряется тем вновь приобретенным знанием, которое возникает у получателя в результате усвоения сообщения.

Количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь понятное смысловое содержание для компетентного получателя и быть бессмысленным для некомпетентного.

На этой идее – оценке информационной содержательности сообщений с учетом «запаса знаний» (тезауруса) получателя или приемника сообщений основывается подход, предложенный Ю.А.Шрейдером.

Тезаурусом (от греческого «сокровище») называют словарь, в котором указаны не только значения отдельных слов, но и смысловые связи между ними. Тезаурус – это совокупность сведений, знаний, которыми располагает получатель информации (человек или система).

В данном изложении под тезаурусом будет пониматься некий обобщенный справочник, определяющий уровень знаний получателя сообщений.

При этом очевидно, что сообщения, которые содержат новую для получателя семантическую информацию, изменяют, обогащают его тезаурус.

Если сообщение не вносит ничего нового в тезаурус получателя, то естественно считать, что смысловая, семантическая информация, которая содержится в этом сообщении, равна нулю. Если одно из двух сообщений изменяет тезаурус весьма незначительно, а другое вносит в него существенные изменения, то естественно считать, что второе сообщение значительно содержательнее, несет в себе значительно большую семантическую информацию. При этом под изменением тезауруса следует понимать не только появление новых понятий, но и установление новых связей между ними, ликвидацию устаревших понятий или связей и т.д.

Можно наглядно показать количественную зависимость семантической информации, которая содержится в одном и том же сообщении, от тезауруса получателя этой информации. Пусть рассматриваемое сообщение представляет собой формулу для вычисления определенного интеграла от логарифмической функции:

.

Для того чтобы извлечь из этого сообщения какую-либо семантическую информацию Ic, получатель должен обладать некоторым тезаурусом Т в данной области знания, причем зависимость Ic = F(Т) можно изобразить графически в виде кривой, имеющей максимум (рис.3).

Дошкольник Школьник Студент Инженер Профессор математики

Рис. 3. Зависимость количества семантической информации в сообщении

от тезауруса получателя

В самом деле, для дошкольника младшего возраста приведенная формула не несет никакой информации, но ребенок возраста 5—7 лет сможет распознать в ней отдельные элементы, например цифры 0, 1, 8.

Школьник младших классов, обладающий большим тезаурусом, обнаружит в этой формуле равенство двух дробей, хотя не поймет еще ни знака интеграла, ни натурального логарифма, ни буквы π.

Старший школьник разберется во всей этой символике, а десятиклассник поймет, что это формула интегрирования. Наибольшую информацию из приведенного выражения извлечет студент 1—2-го курса. По мере дальнейшего возрастания тезауруса новая информация, извлеченная из этого выражения, будет уменьшаться и для профессора-математика будет близка к нулю.

Впрочем, и профессор может нетвердо помнить наизусть формулы интегрирования, и поэтому приведенная формула может и для него нести некоторую небольшую информацию, способствующую вспоминанию или закреплению известных сведений.

Таким образом, одно и то же математическое выражение ничего не говорит человеку, совершенно не знающему математической символики и не имеющему представления об элементарных математических законах и соотношениях (Т = 0, Ic= 0); оно же весьма содержательно для человека, обладающего соответствующей математической подготовкой, но ранее не знавшего сообщенных ему математических соотношений (Т > 0, Ic= Ic макс), и опять становится мало содержательным для высокообразованного математика, который «все это уже давно знает» (Т à Т макс; Icà 0) [21,13].

В области организационного управления и экономики исторически сложилось огромное разнообразие форм документов, а также существует неоднозначность смысла многих терминов, показателей и их кодовых обозначений. Решение проблем рационального представления экономической информации составляет содержание экономической семиотики. В рамках данного научного направления на основе количественного и качественного анализа информационных потоков, обслуживающих экономическую деятельность предприятий и отраслей, делаются попытки формирования структуры тезауруса экономических систем, т.е. совокупности понятий и их взаимосвязей, на основе которых и должны строиться языки управления этими системами. Ведется работа над созданием эффективных систем управленческой документации, проблемно-ориентированных алгоритмических языков, классификаторов. Другими словами, ведется поиск эффективной знаковой системы для отображения информационных процессов в области организационного управления.

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ — конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой.

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций.

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим.

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого.

Синтаксическая, семантическая и прагматическая меры информации

Единицы количества информации, определяемые в рамках вероятностного и объемного подходов, представляют собой разновидности синтаксической меры информации, используемой при наиболее общем подходе, когда предметом рассмотрения является не только информация в узком смысле (например, обрабатываемая компьютером), но все ее виды, включая социальную.

Синтаксическая мера оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. Объем данных в информационном сообщении измеряется количеством символов (разрядов). В различных системах счисления разряды имеют различный вес, соответственно меняются единицы измерения данных. Примерами могут служить бит, нат, трит, дит. В рамках вероятностного подхода синтаксическая мера количества информации определяется степенью изменения неопределенности состояния системы, в рамках объемного подхода характеризует объем информации.

Семантическая мера используется для характеристики информации с точки зрения ее смысла. Семантический анализ дает возможность раскрыть содержание информации и показать отношения между смысловыми значениями составляющих ее элементов. В сочетании с понятием «тезаурус» семантическая мера называется тезаурусной мерой информации. Тезаурусная мера была предложена Ю.И.Шнейдером и получила широкое распространение. Тезаурус – это совокупность сведений, которыми располагает пользователь или система. Другое определение, не противоречащее первому: тезаурус – полнота систематизированного набора данных о предмете информации. В ходе информационного процесса в зависимости от соотношений между смысловым содержанием информации и тезаурусом пользователя изменяется количество семантической информации, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Максимальное количество семантической информации пользователь получает, когда информация ему понятна и несет ранее неизвестные ему (отсутствующие в тезаурусе) сведения. Приобретенное в ходе информационного процесса количество семантической информации является величиной относительной, так как одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для некомпетентного. Мерой семантической информации может служить коэффициент содержательности, определяемый как отношение количества семантической информации к общему ее объему.

Прагматическая мера характеризует полезность (ценность) информации для достижения пользователем поставленной цели. Эта мера также является относительной величиной, зависящей от конкретных потребностей пользователя и условий протекания информационного процесса. В технической системе прагматические свойства информации определяют возможность улучшения качества функционирования системы.

Формы представления информации в ЭВМ. Системы счисления

В физической основе работы вычислительной техники лежит генерация, обработка и передача электрических сигналов. Электрические сигналы разделяют на аналоговые (непрерывные) и цифровые (дискретные). В вычислительной технике применяют цифровые сигналы. Каждому уровню напряжения (тока) ставят в соответствие определённую цифру. Соотнесение параметров электрического сигнала с цифрами отражает связь между техникой и математикой. Современные ЭВМ базируются на двоичной системе счисления, в которой имеются только две цифры – 0 и 1. Выбор в пользу этой системы обусловлен тем, что технически реализовать её проще, чем привычную для человека десятичную систему счисления.

Основной элемент электроники ЭВМ – транзистор, работающий в ключевом режиме. В этом режиме транзистор в зависимости от приложенного к нему напряжения реализует по принципу ключа два логических состояния: открыт ‑ закрыт или включён ‑ выключен. Два этих состояния сопоставляют 0 и 1 двоичной системы счисления — тем математическим объектам, с помощью которых кодируется любая информация, обрабатываемая компьютером. На уровне характеристик электрического сигнала «нулю» может, например, соответствовать напряжение минус 5 вольт, а «единице» — плюс 5 вольт. Или – 15 В и + 15 В. Абсолютные значения напряжений, которым сопоставлены логические состояния 0 и 1, для программной обработки информации несущественны и определяются оптимальными условиями функционирования электронных плат. В устройствах хранения данных информационные «нули» и «единицы» могут быть реализованы иначе: например, на магнитном диске состояниям 0 и 1 соответствуют разные направления вектора намагниченности; в накопителях Flash – отсутствие или наличие электрического заряда в данной микроскопической области вещества; в микросхемах ОЗУ – незаряженный или заряженный конденсатор.

Итак, внутреннее представление любой информации в компьютере является двоичным. В программировании также используются восьмеричная и шестнадцатеричная системы счисления. Кроме того, поскольку пользователем компьютера является человек, важна связь упомянутых систем счисления с десятичной.

Система счисления – принятый способ записи чисел – характеризуется количеством цифр, с помощью которых можно выразить любое число. Все системы счисления можно разделить на два класса: позиционные и непозиционные. Позиционные системы счисления – те, в которых вес цифр зависит от их местоположения в записи числа. Количество цифр в позиционной системе называется основанием системы счисления. Ниже в одном блоке собраны важные определения, относящиеся к системам счисления.

Цифры – символы, используемые в записи числа и составляющие некоторый алфавит.

Число – некоторая величина, которая складывается из цифр по определённым правилам.

Система счисления – способ записи чисел с помощью цифр.

Позиционная система счисления – система счисления, в которой вес цифры зависит от ее местоположения в записи.

Разряд – позиция цифры в числе.

Основание – количество цифр, используемых для записи чисел.

В компьютерах используются позиционные системы счисления.

получившие наибольшее применение в вычислительной технике

Источники:
  • http://studopedia.ru/5_76512_semanticheskiy-podhod-k-izmereniyu-informatsii.html
  • http://taktaev.ru/russian/cnp/using_of_theory/compressing/index.html
  • http://superinf.ru/view_helpstud.php?id=5148
  • http://cyberpedia.su/13x146e3.html
  • http://studfiles.net/preview/4310051/page:2/