операция отождествления символов или групп символов одного Кода с символами или группами символов другого кода. Необходимость К. возникает прежде всего из потребности приспособить форму сообщения к данному каналу связи или какому-либо другому устройству, предназначенному для преобразования или хранению информации. Так, сообщения представленные в виде последовательности букв, например русского языка, и цифр, с помощью телеграфных кодов преобразуются в определённые комбинации посылок тока. При вводе в вычислительные устройства обычно пользуются преобразованием числовых данных из десятичной системы счисления в двоичную и т.д. (см. Кодирующее устройство).
К. в информации теории (См. Информации теория) применяют для достижения следующих целей: во-первых, для уменьшения так называемой избыточности (См. Избыточность) сообщений и, во-вторых, для уменьшения влияния помех, искажающих сообщения при передаче по каналам связи (см. Шеннона теорема). Поэтому выбор нового кода стремятся наиболее удачным образом согласовать со статистической структурой рассматриваемого источника сообщений. В какой-то степени это согласование имеется уже в коде телеграфном (См. Код телеграфный), в котором чаще встречающиеся буквы обозначаются более короткими комбинациями точек и тире.
Приёмы, применяемые в теории информации для достижения указанного согласования, можно пояснить на примере построения «экономных» двоичных кодов. Пусть канал может передавать только символы 0 и 1, затрачивая на каждый одно и то же время t. Для уменьшения времени передачи (или, что то же самое, увеличения её скорости) целесообразно до передачи кодировать сообщения таким образом, чтобы средняя длина L кодового обозначения была наименьшей. Пусть х1, х2,..., xn обозначают возможные сообщения некоторого источника, a p1, р2,..., р2 — соответствующие им вероятности. Тогда, как устанавливается в теории информации, при любом способе К.,
где L≥Н, (1)
—
Энтропия источника. Граница для Lв формуле (1) может не достигаться. Однако при любых pi существует метод К. (метод Шеннона — Фэно), для которого
L ≤ Н + 1. (2)
Метод состоит в том, что сообщения располагаются в порядке убывания вероятностей и полученный ряд делится на 2 части с вероятностями, по возможности близкими друг к другу. В качестве 1-го двоичного знака принимают 0 в 1-й части и 1 — во 2-й. Подобным же образом делят пополам каждую из частей и выбирают 2-й двоичный знак и т.д., пока не придут к частям, содержащим только по одному сообщению.
Пример 1. Пусть n = 4 и p1=9/16, р2 = р3 = 3/16, p4= 1/16. Применение метода иллюстрируется табл.:
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
| х, | Pi | Кодовое обозначение |
|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| х1 | 9/16 | 0 | | |
|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| х2 | 3/16 | 1 | 0 | |
|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| х3 | 3/16 | 1 | 1 | 0 |
|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| х3 | 1/16 | 1 | 1 | 1 |
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
B данном случае L = Н = 1,623. Всё сказанное применимо и к случаю, когда алфавит нового кода содержит не 2, как предполагалось выше, а m> 2 букв. При этом лишь величина Н в формулах (1) и (2) должна быть заменена величиной H/log2m.
Задача о «сжатии» записи сообщений в данном алфавите (то есть задача об уменьшении избыточности) может быть решена на основе метода Шеннона — Фэно. Действительно, с одной стороны, если сообщения представлены последовательностями букв длины N из м-буквенного алфавита, то их средняя длина LN после К. всегда удовлетворяет неравенству LN ≥NH/log2т, где Н — энтропия источника на букву. С другой стороны, при сколь угодно малом ε>0 можно добиться выполнения при всех достаточно больших N неравенства
. (3)
С этой целью пользуются К. «блоками»: по данному ε выбирают натуральное число s и делят каждое сообщение на равные части — «блоки», содержащие по s букв. Затем эти блоки кодируют методом Шеннона — Фэно в тот же алфавит. Тогда при достаточно больших N будет выполнено неравенство (3). Справедливость этого утверждения легче всего понять, рассматривая случай, когда источником является последовательность независимых символов 0 и 1, появляющихся с вероятностями соответственно р и q, p≠q.Энтропия на блок равна s-кpaтной энтропии на одну букву, т. е. равна sH =s(plog2 1/p+qlog2 1/q). Кодовое обозначение блока требует в среднем не более sH + 1 двоичных знаков. Поэтому для сообщения длины N букв LN≤(1+N/s)(sH+1) = N(H+1/s)(1+s/N), что при достаточно больших s и N/s приводит к неравенству (3). При таком К. энтропия на букву приближается к своему максимальному значению — единице, а избыточность — к нулю.
Пример 2. Пусть источником сообщений является последовательность независимых знаков 0 и 1, в которой вероятность появления нуля равна р = 3/4, а единицы q = 1/4. Здесь энтропия Н на букву равна 0,811, а избыточность — 0,189. Наименьшие блоки (s = 2), то есть 00, 01, 10, 11, имеют соответственно вероятности р2 = 9/16, pq = 3/16, qp = 3/16, q2 =1/16. Применение метода Шеннона — Фэно (см. пример 1) приводит к правилу К.: 00→0, 01→10, 10→110, 11→111. При этом, например, сообщение 00111000... примет вид 01111100... На каждую букву сообщения в прежней форме приходится в среднем 27/32 = 0,844 буквы в новой форме (при нижней границе коэффициента сжатия, равной Н =0,811). Энтропия на букву в новой последовательности равна 0,811/0,844 =0,961, а избыточность равна 0,039.
К., уменьшающее помехи, превратилось в большой раздел теории информации, со своим собственным математическим аппаратом, в значительной мере чисто алгебраическим (см. Канал, Шеннона теорема и литературу при этих статьях).
Ю. В. Прохоров.
КОДИ́РОВАТЬ, -рую, -руешь; -анный; сов. и несов., что (спец.).
-я, ср. спец.
Действие по знач. глаг. кодировать.
Кодирование электромагнитных колебаний.
I
ср.1.
процесс действия по несов. гл. кодировать I, кодироваться I
2.
Результат такого действия; кодировка I 1..
II
ср.Психотерапевтический метод лечения человека от вредных пристрастий, основанный на внушении или самовнушении; внедрение в сознание человека своеобразного кода.
КОДИРОВАНИЕ - операция отождествления символов или групп символов одного кода с символами или группами символов другого кода.
КОДИРОВАНИЕ, смотри в статье Код.
comp coding
coding, encoding
n.coding, encoding; кодирование с относительными адресами, relative coding; система кодирования, coding; система ускоренного кодирования, speed-coding system; кодирование беспорядков, hash-coding; побуквенное кодирование, alphabetical, or digital, coding
с.
codificazione
процесс записи информации при помощи кода, например, К. порядка расположения аминокислот в полипептидной цепи последовательностью азотистых оснований нуклеиновой кислоты.
(от франц. code – свод законов, правил) – отображение (преобразование) нек-рых объектов (событий, состояний) в систему конструктивных объектов (называемых кодовыми образами), совершаемое по определ. правилам, совокупность к-рых наз. шифром К., или кодом; каждый конструктивный объект (а также каждый набор таких объектов и вся система конструктивных объектов и их наборов в целом), сопоставляемый при К. к.-л. исходному объекту (объектам, системе объектов), также при этом обычно наз. кодом этого объекта (объектов). Совокупность конструктивных объектов – т.н. "букв", из к-рых состоят наборы, кодирующие исходные объекты К. (кодовые прообразы), наз. алфавитом К.; само К. при этом можно определить как фиксацию ("запись") событий (из нек-рого класса событий) в определ. алфавите; при этом под "буквой" понимается не обязательно к.-л. графич. образ или звук (фонема), – алфавит может состоять из любых четко фиксируемых состояний к.-л. физич. системы. Исходя из вышеуказанного, К. можно кратко охарактеризовать как "языковое" моделирование. Термин "К.", применявшийся первоначально в криптографии (теории засекречивания сообщений), перешел из нее в теорию информации, составной частью к-рой является теория К. В процессе познания и практич. деятельности людей, в технике и обществ. отношениях каждое сообщение обычно проходит через цепь посредствующих звеньев передачи, называемых каналами связи. Поэтому в теории информации К. и характеризуют обычно как преобразование сообщения для передачи его по нек-рому каналу связи. Однако содержание понятия К. не укладывается полностью в рамки совр. теории информации. Понятие К. носит общенауч. характер и имеет широкий филос. аспект.к. – необходимая составная часть процессов управления, процессов преобразования и передачи информации в любых областях действительности; оно в той или иной форме всегда присутствует в процессах познания. Примерами К. могут быть: пользование (естественным) языком (исходными объектами являются представления, мысли и переживания, возникающие в мозгу говорящего; алфавитом К. – алфавит данного языка); телеграфное К. (исходные объекты – выражения языка, использованные для записи текста; алфавит – напр., азбука Морзе); военное и др. К., преследующее цель засекречивания сообщений (алфавит и правила К. и декодирования, т.е. восстановления закодированных образов по их кодам – определяются принятым шифром); преобразование конечных последовательностей цифр, слов, электрич. импульсов, дырочек на перфорированных картах и т.п. в др. последовательности цифр, в др. слова, последовательности импульсов, в элементы к.-л. др. систем и т.д., применяемое в технич. кибернетике (в автоматич. системах управления, при работе на вычислит. машинах и т.п.); употребление символич. обозначений в науке; перевод с одного (естественного или искусственного) языка на др. язык, осуществляемый человеком или машиной; индексирование документов или отд. терминов при составлении различных каталогов (справочников, описаний) в библиотечной, архивной и др. информац. службе; пользование любой системой сокращ. обозначений; использование нотных знаков для записи музыкальных фраз (наборов акустич. колебаний определ. частоты; декодирование происходит при исполнении музыкальных произведений или при чтении партитуры "про себя"); запись (в т.ч. с помощью автоматич. регистрирующих приборов) данных физич. и др. экспериментов (декодирование состоит в обработке этих данных, а на более высоком уровне – в истолковании эксперимент. результатов и в открытии законов природы). Понятие К. не связано с обязат. наличием лица, осуществляющего К. Кодирование наследств. информации в живой клетке происходит, напр., независимо от деятельности к.-л. "кодировщика".
Антропоморфная окраска, присущая распространенной характеристике К. как акта преобразования сообщения, восходит ко времени, когда термин "К." связывался непременно с зашифровкой секретных сведений. Эта окраска сохраняется и поныне в тех разделах кибернетики, где К. производится человеком (напр., при программировании на вычислит. машинах). Но теория информации как таковая, а тем более материалистич. философия не нуждаются в связывании понятия К. с деятельностью "творца" кода или "дирижера" К.
Совокупность кодируемых объектов можно рассматривать в качестве интерпретации полученной в результате К. системы кодовых образов. Последняя может иметь и др. интерпретации (так, восприятия музыканта, читающего партитуру симфонии, отличны от переживаний слушателя, находящегося в концертном зале). О К. говорят, что оно, преобразуя форму сообщения, должно сохранять его содержание; это требование можно уточнить след. образом: К. сохраняет содержание, если различные интерпретации системы кодовых образов изоморфны (в к.-л. смысле, см. Изоморфизм) друг другу; этот изоморфизм достигается, прежде всего, удачным выбором правил К. Проблемы, относящиеся к содержанию (смыслу) сообщений, находятся вне пределов совр. статистич. теории информации. Их рассмотрение проводится на основе понятия о семантической информации. Существенно, что К. может осуществляться независимо от знания или понимания содержания сообщения (так, машинный перевод с одного языка на другой не предполагает, что машина "понимает" переводимый текст). Поэтому к вопросу о сохранении содержания, об инвариантах К. можно подойти, не предполагая к.-л. истолкования кодовых прообразов и образов, а лишь оперируя понятиями однозначности и неоднозначности К. и декодирования.
Применяемые обычно (в технике связи, кибернетике и т.д.) правила К. определяют однозначное отображение исходных объектов в кодовые образы, обусловливая тем самым отношение гомоморфизма между системой прообразов и системой образов К. Однозначное декодирование (не требуя однозначности К.) предполагает однозначность обратного перехода от образов к прообразам (т.е. отношение гомоморфизма между системой кодов-образов и системой кодируемых объектов). Как видно из определения К., результат последоват. выполнения неск. операций К. может быть получен при помощи однократного К. (называемого произведением, или суперпозицией, промежуточных К.). В случае взаимной однозначности всех промежуточных К. декодирование может быть в принципе также осуществлено в один этап. Однако на практике такое декодирование всегда осложняется накоплением случайных ошибок, возникающих на промежуточных стадиях К. Однозначность К. и декодирования достигается не во всех кодовых преобразованиях. Она может быть полностью осуществлена (и обычно осуществляется) в технич. К., но является лишь идеальным случаем при переводах с одного естеств. языка на др. естеств. язык. Отображение, осуществляемое при таком переводе, не является даже гомоморфным (не говоря уже об изоморфизме). С др. стороны, естественные и особенно формализованные языки обладают свойством, в общем случае не присущим коду, – свойством "внутренней организации", к-рое обеспечивается синтаксич. правилами языка. При всей неоднозначности перевода с одного языка на другой естеств. языки позволяют людям с большой точностью выражать свои мысли и общаться друг с другом. Это открывает перед технич. К. принципиальную возможность отказа (в нек-рых случаях) от требования однозначности. На этом пути за последнее время разрабатываются статистич. методы К., учитывающие различную частоту появлений кодируемых событий. Важнейшей задачей теории К., решение к-рой весьма важно для техники, является оптимизация К., состоящая в нахождении наилучших (наиболее экономичных в к.-л. смысле) кодов. Критерием экономичности может быть количество информации, к-рое может быть передано в единицу времени, число букв алфавита К. и др. факторы. Установлено, напр., что любое сообщение может быть закодировано в двубуквенном алфавите (двоичный код – самый распространенный в прикладной кибернетике).
Др. важным требованием, предъявляемым к К., является надежность. Надежность К. достигается в технике применением т.н. самокор- ректирующихся кодов, позволяющих восстанавливать сообщение, искаженное в процессе К. и передачи по каналу связи из-за наличия помех. Для этого на употребляемые при К. комбинации кодовых знаков накладываются дополнит. ограничения (поэтому такой код, неизбежно неся т.н. избыточную информацию, не может быть оптимальным в указанном выше смысле). Надежность – отличительная черта механизмов К., существующих в живой природе. Изучение способов К., естественно возникших в ходе развития органич. мира, является важной задачей науки. Новейшим фундаментальным результатом в этой области являются успехи в раскрытии механизма К. наследственной информации, см. Наследственность.
Лит.: Полетаев И. Α., Сигнал, М., 1958; Эшби У. Р., Введение в кибернетику, пер. с англ., М., 1959; Бриллюен Л., Наука и теория информации, пер. с англ., М., 1960; Яглом А. М. и Яглом И. М., Вероятность и информация, 2 изд., М., 1960; Гнеденко Б. В., Королюк Β. С., Ющенко Е. Л., Элементы программирования, М., 1961; Реймон Ф., Автоматика переработки информации, пер. с франц., М., 1961; Ахманова О. С., Мельчук И. Α., Падучева Е. В., Фрумкина Р. М., О точных методах исследования языка, М., 1961, гл. 6; Дворкин Г. Α., Кодирование наследственной информации в нуклеиновых кислотах, "Журнал общей биологии", 1962, т. 23, No 3, с. 216–26; Энгельгардт В. Α., Расшифровка кода рибонуклеиновой кислоты..., "Наука и жизнь", 1962, No 4, с. 19–20; Bar-Hillel Y., Саrnаp R., Semantic information, "Brit. J. Philos. Sci.", 1953, v. 4, No 14; Crick F. H. С., Barnett L., Brenner S., Watts-Tobin R. J., General nature of the genetic code for proteins, "Nature", 1961, v. 192, No 4809, p. 1227–32.
коди́рование
операция отождествления символов или групп символов одного кода с символами или группами символов другого кода.
* * *
КОДИРОВАНИЕКОДИ́РОВАНИЕ, операция отождествления символов или групп символов одного кода с символами или группами символов другого кода.
— отображение признаков геол. объектов в символах некоторого усл. алфавита. Различается непозиционное кодирование, при котором каждый признак обозн. самостоятельным знаком, и позиционное кодирование, в котором имеет значение не только форма знака, но и его место (позиция) в кодовой записи. В геологии используются 5 основных типов кодирования, различаемых по форме знаковой индикации: цифровое, буквенное, цветовое, геометрическое и конфигурационное.
представление сообщения (информации) в виде совокупности символов, изображений, сигналов и т. п., составленной в соответствии с выбранным кодом; преобразование символов или групп символов одного кода в символы или группы символов др. кода. Цель К. - приспособить форму сообщения к данному каналу связи (напр., для обеспечения Макс. скорости передачи, требуемой помехоустойчивости) либо к к.-л. устройству, предназнач. для переработки или хранения информации (напр., ЭВМ). Так, сообщение в виде текста, состоящего из букв, преобразуется телегр. аппаратом в последовательность электрич. импульсов тока, передаваемых по линии связи; числовые данные в ЭВМ преобразуются из десятичной системы счисления в двоичную (при вводе информации) и наоборот (при выводе информации). Кодированию может быть подвергнута только информация, представл. в виде дискретных сигналов; если кодируемая информация заключена в непрерывном сигнале, то такой сигнал предварительно преобразуется (квантуется) в последовательность дискретных сигналов.
КОДИРОВАНИЕ — процесс записи (см.) или преобразования информации в соответствии с правилами, заданными некоторым кодом (см.), для передачи, переработки млн. хранения; операция отождествления символов млн. групп символов одного кода с символами или группами символов другого кода. Способ, при котором К. осуществляется в машине специальной программой, называют автоматическим К.
coding, encoding
* * *
коди́рование с.coding, encoding (конкретные виды кодирования см. в гнезде код )
оптима́льное коди́рование — optimum coding
статисти́ческое коди́рование — economical [statistical] matching
с.
codifica(zione) f
- абсолютное кодирование
- автоматическое кодирование- блочное кодирование
- кодирование в автокоде
- кодирование в символических адресах
- двоичное кодирование
- импульсное кодирование
- кодирование информации
- кодирование источника данных
- логическое кодирование
- объёмное кодирование
- относительное кодирование
- поблочное кодирование
- полиномиальное кодирование
- последовательное кодирование
- построчное кодирование
- кодирование по форме
- кодирование преобразованием
- символическое кодирование
- кодирование с минимальной избыточностью
- кодирование сообщений
- статистическое кодирование
- цифровое кодирование
- штриховое кодирование
вчт, техн.
кодува́ння
- кодирование состояний
- локальное кодированиевчт, техн.
кодува́ння
- кодирование состояний
- локальное кодирование- англ. coding; нем. Kodierung. 1. Преобразование количественных и качественных данных в числовые или буквенные символы. 2. Операции отождествления символов или групп символов одного кода с символами или группами символов другого кода. 3. Подготовка информации к формализованной обработке. 4. Первая фаза этапа обработки социол. данных.
(CODING) Процесс перевода необработанных исследовательских данных в такую форму, которая может использоваться при подсчетах. Кодирование осуществляется посредством классификации данных на категории и приписывания каждой категории числового значения. Например, в вопроснике, используемом в исследовании политических убеждений, ответам на вопрос о том, как будет голосовать респондент, таким, как «лейбористы», «консерваторы», «либеральные демократы», «не знаю», могут быть присвоены значения 1, 2, 3, 4 соответственно, что делает возможным количественный анализ намерений избирателей. При разработке опроса многие вопросы предварительно кодируются, и интервьюеру (или респонденту, если используется анкета, заполняемая самостоятельно) остается только обвести соответствующее число. В тех случаях, когда невозможно заранее определить варианты ответов, например, когда людей просят прокомментировать особенно сложный политический вопрос, после получения и предварительного анализа в офисе всех ответов разрабатывается кодировочная таблица. С ее помощью различным вариантам ответов присваивается то или иное число, и они кодируются с целью проведения количественного анализа. Кодирование обычно считается частью обследования, но в реальности имеет место всякий раз, когда какие-либо данные классифицируются на категории, и им присваивается числовое значение.
- процесс представления информации с помощью кода (см.) в более компактной и удобной форме для оперирования ею при передаче, обработке и хранении (запоминании). В математич. лит-ре К. наз. отображение произвольного множества А в множество конечных последовательностей (слов) в нек-ром алфавите В. К. социологич. информации - операция присвоения каждому варианту ответа на вопрос, выраженному на естественном языке, условных обозначений - шифров или меток в соответствии с выбранным кодом. Цель К. - обеспечить обработку, хранение и обмен информацией с помощью технич. средств, в т.ч. ЭВМ. Этапу кодирования социологич. информации предшествует этап ее структурирования. Информация считается структурированной, если она представлена в формализованном документе т.наз. альтернативами. Под альтернативой понимается любое суждение, конституирующее структуру данных, для проявления отношения к к-рому достаточно один раз принять решение типа "да - нет". Состояние альтернативы "да" утверждает наличие определенного признака в структуре данных, а "нет" - отсутствие этого признака. Синонимами альтернативы в социологич. лит-ре являются такие понятия, как "кодовая позиция", "градация вопроса", "вариант ответа на вопрос", "значение признака". Переход от описания альтернатив на естественном языке к описанию их на информационном языке (на языке кодов) осуществляется с помощью процедуры К. Целесообразно выбрать наиболее эффективную систему К., к-рая обеспечит минимум затрат труда на этапе подготовки информации к вводу в ЭВМ. При выборе системы К. необходимо руководствоваться рядом принципов: 1. Код выбирается с учетом возможностей тех механич. средств переработки информации, на к-рых будет производиться обработка данных. Продолжительность и общая стоимость обработки в значительной мере зависят от имеющихся технич. средств подготовки данных, алгоритмов и программ, предназначенных для обработки информации, закодированной кодом данного типа. Система К. первичной информации определяется требованиями принятой программы обработки и выбирается по предварительному согласованию с программистом. 2. Система К. выбирается с учетом структуры, размера и общего числа документов, подлежащих формализации. Эффективность системы К. в значительной степени зависит от параметров и xaрактеристики документа, подлежащего К. Так наличие в документе количественных и качественных признаков с совместимыми и несовместимыми альтернативами (многозначными и однозначными ответами), размер и количество документов, форма фиксации информации в документах и уровень формализации документа исключают произвольный выбор системы К. 3. К. или информационный язык, должен быть простым и удобным для К. соц. информации, т. е он должен обеспечивать адекватное и однозначное К. при минимальных затратах труда. Простота кода и удобство его применения зависят прежде всего от его основания. 4. Выбранный код должен обеспечить минимум логич. и механич. операций на всех этапах подготовки данных, начиная с К. и кончая вводом информации в ЭВМ. 5. Информационный язык должен выбираться с учетом всех возможных в данном исследовании методов анализа имеющейся информации. Систему К. необходимо выбирать и внедрять на этапе разработки полевых документов, учитывая конкретные особенности имеющейся техники и математич. обеспечения. Если в качестве полевого документа применяется анкета, то код следует заранее напечатать на ее полях. В том случае, когда используется бланк интервью или др. документы, на к-рых невозможно заранее напечатать код, информацию можно фиксировать на специальных кодировальных листах, представляющих собой сетку с нанесенными на нее числами, расположенными в порядке возрастания. Лит.: Курбаков К.И. Кодирование и поиск информации в автоматическом словаре. М., 1968; Молчанов В.И. Социальная информация и управление предприятием. М., 1977; Методы сбора, обработки и анализа социальной информации. Л., 1984; Как провести социологическое исследование. М., 1985. Н.И. Ростегаева.
- англ. coding; нем. Kodierung. 1. Преобразование количественных и качественных данных в числовые или буквенные символы. 2. Операции отождествления символов или групп символов одного кода с символами или группами символов другого кода. 3. Подготовка информации к формализованной обработке. 4. Первая фаза этапа обработки социол. данных.