Процесс дешифровки древних текстов

Общая характеристика латинского письма, его значение. Разграничение методов криптографии и древней письменности. Специфика задач и методов дешифровки данных. Особенности деления текста для ее применения. Анализ задач дешифровки на конкретных этапах.

Рубрика Иностранные языки и языкознание
Вид курсовая работа
Язык русский
Дата добавления 17.10.2010
Размер файла 32,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

24

Содержание

    • Введение
    • 1. Латинское письмо
    • 2. Криптография и исторические письмена
      • 2.1 Разграничение методов криптографии и древней письменности
      • 2.2 Задачи и методы дешифровки
      • 2.3 Методы дешифровки
    • 3. Дешифровка текста
      • 3.1 Деление текста для дешифровки
      • 3.2 Задачи дешифровки на конкретных этапах
    • Заключение
    • Список литературы
    • Введение

При изобретении письма можно было графически кодировать основные единицы языка, т.е. фонемы, морфемы, словоформы, предложения. В двух последних случаях потребовалось бы настолько большое количество знаков, что реализовать их практически было бы невозможно. Древние изобретатели письма независимо друг от друга остановились на графическом кодировании морфем - наименьших смысловых единиц в языке. При этом можно было широко использовать в качестве материала пиктографические знаки, закрепляя за ними определенное чтение и значение.

Однако многие понятия изобразить было по меньшей мере затруднительно. Изобретатели письма пользовались двумя приемами. Первый состоял в широком использовании омонимов, т. е. знаку придавался не первоначальный, а совсем другой смысл. Этот прием, в свою очередь, вызвал появление ключевых знаков (детерминативов), указывающих смысл. Таким образом, морфема стала передаваться знаком, указывающим чтение (но не смысл), и детерминативом, указывающим смысл, но не имеющим чтения. Второй прием состоял в использовании знаков, передающих самые короткие по фонетическому составу морфемы, для передачи частей других морфем. При этом, естественно, также могли употребляться детерминативы, проясняющие смысл.

Другая трудность состояла в передаче служебных морфем, изобразить которые было невозможно. В этом случае также использовались знаки, фактически ставшие фонетическими. Появление последних дало возможность уточнять чтение с помощью звуковых подтверждений, обычно передающих начало чтения знака.

Таким образом, в ранних системах письма (иероглифических) стали употребляться три вида знаков: имеющие только чтение (фонетические), имеющие чтение и смысл (обычно называемые идеограммами), имеющие только смысл (детерминативы).

В некоторых ранних вариантах иероглифики (андское, рапануйское, протошумерское письмо) широко употреблялось аббревиатурное написание, при котором фиксировались в основном знаменательные корневые морфемы, составляющие смысловой костяк предложения, а служебные морфемы не указывались. Так как в контексте знаки корней фактически передавали словоформы, они получили название логограмм.

В дальнейшем иероглифическое письмо (сохранившееся в Китае и Японии), слишком громоздкое по количеству знаков и орфографии, сменилось чисто фонетическим в нескольких разновидностях соответственно характеру языков (слоговое, фонемное, консонантное). Появились даже инфрафонемные алфавиты, в которых одной фонеме соответствовала группа знаков (огамическое и некоторые виды рунического письма). Как правило, в фонемных алфавитах единый принцип полностью не выдерживается; например, некоторые знаки передают две фонемы, и, наоборот, некоторые фонемы передаются группами знаков.

Цель данной работы - рассмотреть процесс дешифровки древних текстов.

Задачи:

1. выявить особенности древнего текста, в частности, латинского письма;

2. разграничить методы криптографии и дешифровки текстов;

3. рассмотреть основные задачи дешифровки;

4. изучить основные методы дешифровки;

5. выяснить деление текста для дешифровки;

6. определить конкретные задачи на этапах дешифровки.

1. Латинское письмо

Латинское письмо - алфавитное письмо, которое первоначально употреблялось только для записи текстов на латинском языке; позднее легло в основу письменностей большинства народов Европы, Америки, Африки, Океании, а также некоторых народов Азии.

Существует две теории происхождения латинского письма. Согласно одной из них, латинский алфавит восходит к греческому письму города Кумы, согласно другой - представляет собою результат приспособления этрусского письма к фонетике латинского языка.

Древнейшие памятники латинского письма датируются седьмым - шестым веками до н. э. (надпись на серебряном сосуде из Пренесте, надпись на каменной плите из святилища Ромула на Форуме, надпись на золотой застежке и др.). В древнейших памятниках встречается направление письма как справа налево, так и слева направо. Надпись на плите из святилища Ромула на Форуме выполнена бустрофедоном. С четвертого века до нашей эры окончательно устанавливается направление письма слева направо. В античную эпоху знаки препинания отсутствовали, так же как и строчные буквы. Слова иногда отделялись друг от друга словоразделительными знаками. Знаки препинания и деление на прописные и строчные буквы возникли только в позднеантичное время Мусорин А.Ю. Словарь письменностей народов мира. / Сибирский лингвистический семинар. - Новосибирск, 2001. - № 1. - С. 52-55. .

Древнейшее латинское письмо принадлежит к ярко выраженному маюскульному письму (маюскул). От античности дошли два типа книжного письма - каллиграфическое и близкое к эпиграфическому монументальное, или квадратное письмо, и более простое рустическое (букв. грубое, деревенское) письмо, которое широко применялось в римских рукописных книгах. Выделяется отдельный тип письма, используемый для написания документов - актуарное. Для бытовых записей в Древнем Риме использовался очень беглый и крайне трудночитаемый старый римский курсив. Со второго века н. э., в связи с широким распространением пергамена, начертания букв становятся все более и более округлыми, формируется новый тип книжного письма - унциал (от слова uncus 'крюк'). Унциал также принадлежал к маюскульному типу, хотя многие буквы уже выходили за пределы верхней и нижней линий. Примерно начиная с третьего века н. э. маюскул постепенно начинает вытесняться минускулом. На основе последнего сформировались многочисленные раннесредневековые шрифты, получившие название провинциальных, или областных, так как каждый из них был распространен на какой-либо ограниченной территории Федорова Е.В. Введение в латинскую эпиграфику. - М.: Просвещение, 1982..

2. Криптография и исторические письмена

2.1 Разграничение методов криптографии и древней письменности

Изучение исторических систем письма можно рассматривать, прежде всего, как задачу извлечения из неизвестного нам текста информации о структуре самого текста, что является основой дешифровки исторических систем письма.

Имеется осмысленный текст, записанный на неизвестном языке. Нужно, исходя в первую очередь из самого текста, выяснить свойства неизвестного языка и уже затем путем сопоставления с известными языками и привлечения с большой осторожностью внетекстовой информации (археологических, исторических, филологических и иных сведений) передать смысл неизвестного текста. Возможность исследовать текст формальными методами перерастает в необходимость, если мы хотим максимальным образом исключить субъективный анализ текста. Нас интересует именно этот аспект дешифровки, поскольку он допускает точную постановку задачи, хотя это только одна из подзадач при изучении неизвестных текстов.

Прежде чем перейти к уточнению задачи дешифровки исторических систем письма, сделаем два замечания.

Часто дешифровка исторических систем письма ассоциируется с дешифровкой секретных шифров, что приводит к мысли о применении методов последней для исследования неизвестных письменных источников. От этого необходимо всячески предостеречь. Задачи, решаемые криптографией и дешифровкой исторических систем письма, почти противоположны, и методы первой могут весьма ограниченно применяться во второй.

Действительно, в криптографии предполагается, что исходный, незакодированный текст написан на известном языке, причем обычно либо этот язык хорошо известен, либо круг кандидатов на эту роль из числа хорошо известных языков весьма невелик. Последним обстоятельством объясняется успех американской разведки, которая для передачи секретных сообщений использовала редкий язык американских индейцев, мало кому известный, так что сообщения передавались без зашифровки Введение в криптографию. / Под ред. Алексеевой А.Т. - М.: ВЛАДОС, 2005..

Хотя язык текста и криптографии предполагается известным, зашифрованный текст может быть весьма сложным образом связан с исходным текстом. Цель криптографии состоит в восстановлении исходного текста по зашифрованному тексту, в котором всякого рода статические распределения элементов текста могут очень сильно отличаться от соответствующих распределений элементов в исходном тексте.

В задачах криптографии известен язык исходного текста, но неизвестно преобразование, благодаря которому возник исследуемый текст. В задачах дешифровки исторических систем письма неизвестен язык, на котором написан текст, но сам текст не подвергался специальной обработке, имеющей целью затруднить чтение текста; текст записан в соответствии с нормами орфографии данного языка Пробст М.А. Исследование неизвестных текстов. - М.: Просвещение,1983. - с.-11-22..

Из всего сказанного видно, что методы криптографии могут быть применены для целей исследования исторических систем письма весьма ограниченно. Они могут быть рассмотрены лишь как набор статистических методик обработки текста. В дальнейшем мы не будем касаться вопросов криптографии, и поэтому употребление термина «дешифровка» будет иметь однозначный характер.

2.2 Задачи и методы дешифровки

Одна из основных задач дешифровки текста состоит в выяснении структуры текста, принципов его построения и построении формальной грамматики языка текста. Отсюда ясно, как велико значение дешифровки в общем цикле семиотических проблем, таких, как формализация перевода текста с одного языка на другой, формализация процессов реферирования, сжатия текста и информационного поиска и т. п.

Под формальной грамматикой текста мы понимаем набор структурных элементов, выделенных в тексте, подобных знакам алфавита, морфемам, словоформам, и выведение законов взаимодействия внутри наборов и между наборами, правил преобразований и построений.

При исследовании текста формальными методами можно получить формальное описание структуры текста и формальную грамматику (насколько позволяют объем и характер текста), но нельзя установить смысл текста. Это можно сделать, привлекая материалы известных языков.

Прежде чем перейти к изложению общих принципов изучения неизвестных систем письма, нужно уточнить, что мы понимаем под терминами «знак текста» и «текст».

Первой задачей исследования лингвистического текста является составление каталога знаков текста, выявление аллофонов и т. п. При этом возникает вопрос: что же считать знаком текста? Для того чтобы сформулировать формальное понятие «знак текста», выясним, что мы обычно вкладываем в это понятие. Интуитивно мы предполагаем, что текст является последовательностью некоторых частей, причем «самые мелкие» части текста, из которых состоят другие конструкции текста (морфемы, словоформы, предложения), и есть знаки текста. Но эти «мелкие части» текста еще достаточно велики, чтобы появляться в тексте самостоятельно, без постоянного сопутствующего набора других таких же частей текста.

Таким образом, знаком текста мы будем называть элемент такого разбиения всего текста, при котором будут выполняться два условия:

- каждый элемент разбиения текста имеет самостоятельное распределение в тексте, т. е. появление знака в тексте не может однозначно предсказать появление в тексте соседних с ним других знаков;

- если разбить текст на более мелкие части, то последние не обладают самостоятельным распределением (иначе говоря, при фактическом самом мелком разбиении текста на части каждый элемент разбиения должен иметь самостоятельное распределение в тексте).

Очевидно, что судить о распределении частей текста в нем самом можно достаточно надежно, если текст достаточно велик, т. е. если объем текста - общее число частей, на которое разбился весь текст, - на порядок больше числа различных частей текста.

Мы все время говорили «знак текста», считая, что нельзя поставить знак тождества между понятиями «знак текста» и «знак системы». В системе, например, текстов, написанных на русском языке, мы под знаком понимаем знаки русского алфавита. Но в небольшом тексте некоторые знаки могут встречаться только в паре, и тогда за знак текста нужно принять именно пару, хотя каждый из знаков пары может являться знаком системы текстов, т. е. иметь в ней самостоятельное распределение.

Данное выше определение знака текста как наиболее мелкой части текста, имеющей самостоятельное распределение, представляется разумным по следующим соображениям. В неизвестном тексте из-за весьма небольших объемов не всегда легко проверить самостоятельность распределения частей текста. Поэтому лучше, если есть колебания между более крупным и более мелким разбиениями текста, принять за знак элемент более крупного разбиения и проводить исследования текста, взяв за основу крупное разбиение. Если же исследование покажет, что появление одного и того же знака в тексте может оцениваться по-разному, если учитывать части знака, и что введение в рассмотрение более мелких частей помогает в изучении текста, то мы можем дополнительно изучить распределение мелких частей и более крупных. Если же идти от более мелкого разбиения к более крупному, то можно получить такое обилие данных, разобраться в котором затруднительно, и, кроме того, все то, что изучалось при более мелком разбиении, может оказаться излишним в случае, если знаком окажется элемент более крупного разбиения текста.

Для лингвистических текстов характерно линейное построение текстов в отличие, например, от живописных или музыкальных. Наличие в тексте конструкции, структуры означает, что между знаками или группами знаков текста имеются функциональные соотношения, которые и определяют конструкцию текста. Для лингвистических текстов характерно, что большинство этих функциональных соотношений имеет локальный характер, т. е. связи между элементами текста в большинстве случаев относятся к «близким» по последовательности элементам (самим знакам или группам знаков): элементы текста, связанные функциональными соотношениями, находятся в большинстве случаев недалеко друг от друга в тексте.

Система, с которой связан текст, задает не только конструкцию, способы построения текста, но и все виды, способы преобразования текста, или, как говорят, способы допустимых преобразований текста, после которых получается снова текст в той же системе История лингвистики. / Сост. Кварков С.М. - СПб.: Речь, 2004. .

Все ранее сказанное о тексте относится к тому, как он устроен, но не к его смыслу. Конечно, нельзя считать, что между текстом и конструктивно-функциональной структурой того же текста нет связи. Но это не такая связь, с помощью которой можно, зная одно (конструкцию или смысл), найти другое (смысл или конструкцию). Это - соответствие между двумя системами, одна из которых определяет конструктивные и функциональные свойства текстов, а другая - смысл и содержание заданных текстов и взаимоотношения между содержанием различных текстов. Большинство простейших морфологических преобразований слов и предложений мало меняют смысл преобразуемого объекта. Например, такие преобразования, как изменение слова по падежам, родам, по лицам или по временам, и сходные переходы от одних форм слова к другим мало меняют содержание самого слова. Аналогичным образом ведут себя и такие элементарные преобразования предложения, как конверсия и изменение порядка следования, например существительного и согласованного определения к нему. Такое небольшое изменение смысла отличает элементарные преобразования, но уже для композиции элементарных преобразований (сложных, составных преобразований) это нехарактерно. Но, по-видимому, нет преобразований в языке, которые хоть в самой малой степени не затрагивали бы, не изменяли смысла преобразуемого объекта.

Из всего этого следует, что хотя и есть определенная коррелятивная зависимость между конструктивной и смысловой стороной текста, но нельзя по конструкции определить полностью смысл текста, и наоборот.

Подводя итоги, можно сказать, что лингвистический текст есть некоторая линейная последовательность знаков, построенная по правилам определенной системы, причем текст обладает смыслом, несводимым к правилам построения текста.

Задачи дешифровки касаются обоих аспектов, но исследование должно проводиться по этапам: на первых этапах нужно выяснить как можно полнее структуру исследуемого текста и построить, насколько возможно, формальную грамматику языка, на котором написан текст. Затем, используя и факты сравнительного языкознания, и дополнительные внетекстовые данные, нужно конкретизировать грамматику неизвестного языка и только затем переходить к изучению смысла текста Владимиров Л.И. Всеобщая история книги. - М.: ВЛАДОС, 2005. - с. 35-48..

2.3 Методы дешифровки

Основным методом изучения неизвестных текстов мы считаем позиционную статистику. Обычно при дешифровке широко используются такие простые статистические методы, как составление частот знаков алфавита, частотные словари и т. п., т. е. такие приемы, которые дают частотные характеристики знаков, морфем, словоформ в тексте, не связывая частотные характеристики хотя бы и с простейшей структурой текста. Такого рода частотные характеристики могут лишь ответить на вопрос "чего больше?", но по ним почти нельзя судить о зависимостях, соотношениях, имеющихся в тексте между различными единицами текста.

Под позиционной статистикой текста мы понимаем такие частотные характеристики, которые связывают единицы текста с некоторой структурой текста, с положением, занимаемым этими единицами в тексте. Мы полагаем, что такого рода частотные характеристики позволяют выяснить закономерности, имеющиеся между различными элементами текста.

Действительно, если для двух единиц текста известны данные позиционной статистики, т. е. определены позиция в тексте и известно распределение частот этих единиц по позициям в тексте, то можно выяснить, сравнивая распределения, находятся ли эти единицы в определенной позиции в тексте и вообще как появление одной единицы в определенной позиции в тексте предсказывает появление другой единицы в определенной позиции.

Примером позиционной статистики знаков текста может быть распределение частот знаков текста в зависимости от положения - позиция знака внутри слова. На основе таких статистических данных можно выявить характерные позиции знака внутри слова (инициальная, медиальная, финальная) и наметить подходы для выявления морфологии. Если аналогичным образом исследовать морфемы внутри слова, то можно выявить сочетаемость морфем между собой, функциональное соотношение между ними. Применение такого же приема к исследованию слов внутри предложения может привести к выяснению закономерностей сочетания слов внутри предложения. Но что в таком случае считать позицией в тексте?

Под позицией в тексте мы понимаем любой способ, указывающий на место в тексте. Например, для знака в тексте позицией знака может быть порядковый номер знака от начала или от конца текста, указание на порядковый номер слова и расстояния знака внутри слова от концов слова и много других способов. Очевидно, что, чем больше система, определяющая позицию, связана со структурой текста, тем больше сведений о тексте, об определяющих его соотношениях мы можем получить на основе позиционной статистики. Поэтому ценность данных позиционной статистики в значительной мере зависит от того, насколько удачно выбрана система, определяющая позицию в тексте.

В различных методах исследования неизвестных текстов можно выделить несколько разных направлений. Одни «идут на поводу» у текста, другие - на поводу у всякого рода побочной информации или вообще используют «интуитивный метод», в котором на самом деле под словом «интуиция» скрывается просто нечеткая алгоритмическая постановка задачи. С другой стороны, появилось много работ с достаточно точными алгоритмами для решения конкретных задач по дешифровке, что во многих случаях вызвано использованием средств вычислительной техники. Нам представляется, что методика дешифровки, предложенная Ю.В. Кнорозовым, является одной из наиболее удобных для решения конкретных задач дешифровки исторических текстов.

Таким образом, в начале исследования предполагается, что неизвестный текст записан на некотором, пока для нас неизвестном, но естественном языке, предназначен для обмена информацией и не подвергался специальным преобразованиям типа зашифровки с целью затруднить чтение этого текста. Предполагается, что в тексте существует определенная структура связей, причем для большинства случаев связи в тексте проявляются на небольшом расстоянии и близкие по тексту элементы находятся в некотором соотношении. Поэтому основной метод - позиционная статистика. Так как исследуемые тексты часто бывают весьма небольших объемов, обычные статистические методы оказываются малоэффективными. Отсюда основной прием при проведении исследований - итеративный способ поиска решений. В этом случае ищется решение задачи лишь для наиболее достоверных элементов, затем полученное лишь для части интересующих случаев решение используется в следующей подзадаче, и решение этой следующей подзадачи, хотя бы и частичное, используется для уточнения решений подзадач предыдущих этапов. Такой способ важен еще и тем, что дает возможность получать данные одного уровня надежности Киселева Л.И. О чем рассказывают рукописи. - СПб.: Речь, 2003..

3. Дешифровка текста

3.1 Деление текста для дешифровки

При дешифровке неизвестных текстов основным и решающим источником информации являются сами тексты. Однако о любом тексте всегда имеется дополнительная информация, которую можно использовать для целей дешифровки. Так, сведения о времени, к которому относятся тексты, дают возможность ограничить круг поисков лингвистических и графических аналогий и определить хронологический разрыв между изучаемым языком и языком-потомком. Сведения о месте находки и объекте, на котором начертан текст, могут дать указания о его содержании. Иногда тексты сопровождаются изображениями, которые могут оказаться важным источником дополнительной информации (Приложение 1).

Неизвестный текст может сопровождаться параллельным известным текстом. Последний может оказаться либо независимым текстом на ту же тему (псевдобилингва), либо переводом неизвестного текста (билингва). Значение билингвы для дешифровки трудно переоценить. Дешифровщик как бы получает специально подготовленное учебное пособие (как известно, такие пособия - параллельное издание иностранного текста и перевода - широко используются и при изучении иностранных языков). Однако отсутствие билингв вовсе не означает невозможности дешифровки Лотман Ю.М. Лингвистические особенности текстов. - М.: Просвещение, 1997. .

Изучение текста требует его формализации. Прежде всего, текст должен быть транскрибирован стандартными знаками. В качестве последних могут быть использованы стандартизированные знаки изучаемого письма, а также (для удобства обработки и публикации) общепринятые знаки (цифры, буквы). Эта работа требует не только большой точности, но и приобретения специальных навыков - овладения данным шрифтом и индивидуальным почерком. Составление транскрипции предусматривает опознание всех вариаций написания, а также полустертых и искаженных графем, восстановление утраченных мест, обнаружение ошибок и внесение конъектур. Эта работа обычно не бывает закончена к моменту дешифровки и продолжается по ходу дешифровки и после нее. Ошибки при опознании графем представляют значительную опасность, так как исправление их затруднительно.

По ходу составления унифицированной транскрипции возникает необходимость в составлении каталога графем (т. е. знаков и их аллографов). Составление каталога дает возможность начать планомерную работу по выявлению аллографов, выделить особые группы знаков (например, цифры) и «модель порождения» знаков, развернуть работу по сопоставлению изучаемого алфавита с известными, а иногда и по опознанию изображаемых знаками предметов, что может дать важную дополнительную информацию Кнорозов Ю.В. Неизвестные тексты. // Забытые системы письма. - М.: Просвещение, 1982. - С. 3-10.

При формальном изучении текстов исследователь временно игнорирует всю дополнительную информацию, сосредоточиваясь исключительно на той, которую несут сами тексты. Дополнительная информация оказывается необходимой на более поздних этапах изучения текстов.

Для удобства исследования текст целесообразно рассматривать как ряд морфем, расположенных в последовательности, свойственной данному языку. Общее количество морфем в любом языке не зависит от количества фонем и не превышает синхронно 1500. Стабильность количества морфем определяется свойствами человеческого мозга. Превышение критического количества создает трудности для запоминания (оперативной памяти). В свою очередь, значительное уменьшение числа морфем повлечет за собой удлинение словоформ и создаст трудности для их распознавания (т. е. для восприятия устной речи). Возможное число сочетаний фонем резко ограничено законами образования морфем в данном языке (фиксированные ограничения). Морфема - наименьшая семантическая единица языка, и поэтому она обычно является предельным референтом знака письма. Каждая группа тождественных морфем характеризуется позициями этих морфем в ряду (адресами) и частотой.

Все морфемы можно подразделить на корневые и служебные. Такое подразделение имеет относительный характер, так как в ряде случаев корневые морфемы могут употребляться в качестве служебных. Однако данная морфема, занимающая конкретную позицию в ряду, является альтернативно либо корневой, либо служебной.

С помощью служебных морфем образуются словоформы, и осуществляется связь между словами в предложении. Количество морфем в словоформе обычно практически не превышает пяти. Общее количество служебных морфем, естественно, значительно меньше, чем количество корневых. Так как одна и та же служебная морфема соединяется с различными корневыми морфемами, частота наиболее употребительных служебных морфем должна намного превышать частоту корневых морфем. Однако в специфических текстах (где часто повторяются некоторые слова) рекордную частоту могут иметь и корневые морфемы. Чтобы избежать влияния специфики текста, целесообразно учитывать помимо абсолютной частоты также относительную, исключая повторяющиеся блоки. При этом рекордные по абсолютной частоте корневые морфемы займут соответствующее место независимо от специфики текста.

Ряд морфем, составляющих текст, может быть разделен на отдельные цепочки, соответствующие морфемам, словоформам и предложениям данного языка. Для целей дешифровки имеет смысл разделить текст на цепочки, соответствующие словоформам.

Общепринятой формой изучения языка является составление словарей и грамматик. Сведения по лексике сосредоточиваются именно в словарях. Поэтому при изучении языка неизвестного текста также целесообразно иметь упорядоченный набор цепочек, представляющих лексику данного языка.

В словоформах служебные морфемы располагаются обычно в начале и конце, а в некоторых языках и в середине слова (внутренняя флексия). При разбивке текста на цепочки практически целесообразно включать в состав словоформы не только корневые, словообразующие и словоизменяющие морфемы, но также и все остальные служебные морфемы (например, предлоги и послелоги, частицы, союзы). Дело в том, что дешифровщик, ставящий задачу не допускать присоединения к словоформе служебных морфем (выделяемых в грамматиках в качестве самостоятельных частей речи), должен иметь критерии, позволяющие отделить словообразующие и словоизменяющие морфемы от остальных служебных морфем. Такие критерии вообще дать очень трудно, а до начала исследования текста просто невозможно. Наоборот, именно изучение текста может дать основания для классификации служебных морфем. Однако если даже и удалось бы отделить словообразующие и словоизменяющие морфемы от остальных служебных, то изучение последних от этого только затруднилось бы. В самом деле, грамматические функции служебных морфем можно определить, только изучая их сочетания со знаменательными словами, а в этом случае служебные морфемы оказались бы от них изолированными.

Иногда к словоформе приходится присоединять и определение. Это целесообразно в тех случаях, когда определение выражено неизменяемыми словами, лишенными своих служебных морфем и именно поэтому практически неотличимы от них в неизвестных текстах.

Таким образом, неизвестный текст целесообразно разделить на отдельные цепочки, в целом соответствующие словоформам, к которым присоединены также служебные морфемы непосредственного окружения и неизменяемое определение. Такие цепочки получили название блоков.

3.2 Задачи дешифровки на конкретных этапах

Перейдем теперь к описанию конкретных задач, определяемых различными этапами исследования неизвестных текстов.

Одна из первых задач - разбиение непрерывного текста (написанного без пробелов) на отдельные блоки, соответствующие в основном словоформам. В проводимых работах использовался следующий прием. Выбиралась некоторая константа h, и рассматривались всевозможные отрезки текста, содержащие h знаков. Каждому такому отрезку текста сопоставлялось множество пересечений данного отрезка со всеми другими отрезками текста. Каждое пересечение снабжалось адресом. составлялся каталог всех пересечений в тексте, и выделялись наиболее частотные пересечения. Адреса давали возможность объединить два пересечения в одно, если они в тексте находились рядом. Такой метод позволял выделить в тексте устойчивые знакосочетания, обладающие переменными знаками при сохранении общей структуры знакосочетания. Отсюда появлялась возможность исследования не только структуры словоформы, но и синтаксической структуры текста Бречко Р. Алгоритмы шифрования. - М.: ВЛАДОС, 2000..

Следующая задача - анализ морфологии слова. В эту задачу входят разбиение каждого блока на отдельные части и классификация их с целью выделения постоянных и переменных частей, соответствующих корневым и служебным морфемам.

Важной и необходимой задачей, сходной с предыдущей, является выяснение структуры предложения. На основе полученных данных можно ставить задачу о выявлении классов блоков, как по морфологической, так и по синтаксической структуре. Иначе говоря, это, с одной стороны, выделение блоков, имеющих одинаковую постоянную часть, т. е. с одним корнем, а с другой - выделение блоков, имеющих один и тот же набор переменных частей. На основе самого текста отнести блоки к конкретным традиционным частям речи без дополнительной внетекстовой информации невозможно, хотя можно учитывать, например, что во многих языках для глагола характерны большее количество словоизменительных форм и большая сочетаемость с формами другого класса, а для существительных - малое количество словоизменительных форм и малая сочетаемость.

Для изучения морфологии очень важно составление прямых и обратных словарей, а также словарей, ориентированных по произвольному знаку в блоке.

Очень удобным инструментом является составление конкордансов. Выбираются как бы основные, нечто вроде координат, позиции в тексте и с помощью этих позиций характеризуется положение единицы. Например, если мы исследуем положение знака в тексте, а текст разбит на слова и предложения, то мы можем характеризовать положение знака номером предложения, номером слова и предложения и положением знака в слове - расстоянием от начала или конца. Аналогично можно говорить не только про знак, но и про морфему, нечто похожее будет при исследовании слова в предложении, в абзаце. Используя конкордансы, можно всегда выделить все сочетания заданной структуры.

При исследовании как структуры словоформы, как и синтаксической структуры текста удобно использовать прием, названный нами «окружением». В этом случае для каждого исследуемого элемента текста - это может быть знак текста, группа знаков и т. п. - указываются группы из n элементов текста, которые «окружают» в тексте слева и справа исследуемый элемент. Такие окружения позволяют выявить связи между исследуемым элементом и другими «близкими к нему» частями текста.

В заключение хотелось бы отметить, что исследования неизвестных текстов интересны еще и тем, что ставят ряд задач, имеющих и самостоятельное значение. Например, имеются тексты, записанные двумя разными способами: неизвестным иероглифическим письмом и известным фонетическим, причем есть вероятность, что хотя они и не обладают тождественным содержанием, но являются текстами на одну тему, аналогично вариантам одной и той же сказки или другого вида народного творчества.

Заключение

В Древнем Египте использовали три системы письма: иероглифическую, иератическую и демотическую. Иероглифическая система, изобретенная за 3000 лет до н.э., представляет собой самую раннюю форму древнеегипетской письменности. Ее элементами являются картинки, или пиктограммы, а использовалась она для религиозных текстов. Иератическое письмо - это упрощенная, скорописная форма иероглифического, употреблявшаяся при составлении юридических и деловых документов. Демотическое письмо, еще один вид скорописи, возникло примерно в 600г. до н.э.http://raskopki.narod.ru/egept_writing_stone.html Его использовали в каждодневной жизни для самых разных целей, тогда как иероглифическая и иератическая системы в то время применялись лишь для религиозных текстов.
Единственная проблема с египетской письменностью - проблема, стоявшая перед учеными почти 2000 лет,- состояла в том, что до самого начала 19-го столетия ни один человек не мог ее понять.

В 1799г. в Розетте, неподалеку от Александрии в Египте, был найден большой черный базальтовый камень, с записью декрета фараона Птолемея 5. На нем были сделаны записи в трех системах письма: иероглифической, демотической и на греческом языке. Этот камень, названный Розеттским, оказался одной из наиболее важных находок для египтологов, поскольку он содержал ключ к пониманию иероглифическую письма. Сопоставляя греческий и иероглифический тексты, француз по имени Ж.Ф. Шампольон сумел в конце концов разгадать тайну иероглифов. Это произошло в 1822г. Последовавший затем перевод письменных документов дал нам огромное количество информации о Древнем Египте.

Список литературы

1. Бречко Р. Алгоритмы шифрования. - М.: ВЛАДОС, 2000.

2. Введение в криптографию. / Под ред. Алексеевой А.Т. - М.: ВЛАДОС, 2005.

3. Владимиров Л.И. Всеобщая история книги. - М.: ВЛАДОС, 2005.

4. История лингвистики. / Сост. Кварков С.М. - СПб.: Речь, 2004.

5. Киселева Л.И. О чем рассказывают рукописи. - СПб.: Речь, 2003.

6. Кнорозов Ю.В. Неизвестные тексты. // Забытые системы письма. - М.: Просвещение, 1982.

7. Лотман Ю.М. Лингвистические особенности текстов. - М.: Просвещение, 1997.

8. Мусорин А.Ю. Словарь письменностей народов мира. / Сибирский лингвистический семинар. - Новосибирск, 2001. - № 1.

9. Пробст М.А. Исследование неизвестных текстов. - М.: Просвещение,1983.

10. Федорова Е.В. Введение в латинскую эпиграфику. - М.: Просвещение, 1982.


Подобные документы

  • Некоторые исторические системы письма. Письменность древних европейских цивилизаций. Руническая письменность. Система письма древнеамериканской цивилизации майя. Особенности дешифровки древних текстов. Чтение древнеегипетских и эламских иероглифов.

    курсовая работа [667,6 K], добавлен 07.03.2012

  • Этапы развития шумерской письменности. Логографическое и словесно-слоговое письмо, их особенности, характерные черты. Динамика развития фонетического письма на ранних этапах письменности. Влияние клинописи на формирование других систем письменности.

    реферат [22,8 K], добавлен 02.06.2014

  • Значение изобретения письменности для развития культуры в целом и для делопроизводства в частности. Главные этапы развития письменности. Идеографический, словесно-слоговый, силлабический и алфавитный типы письма. Зарождение славянской письменности.

    курсовая работа [62,4 K], добавлен 15.03.2014

  • Развитие латинского и греческого письма. История изобретения алфавита. Угаритский и хурритский язык. Развитие письма. Гласные, долгота и краткость. Монофтонги и дифтонги. Памятники минойского письма (XI—XII в. до н.э.). Окситон, парокситон, периспомен.

    курсовая работа [48,4 K], добавлен 20.08.2015

  • Происхождение алфавитного письма, употребление алфавитов в современном мире. Развитие строчных букв. Особенности северносемитского письма, его фонематический характер. Характеристика греческого и латинского письма. Кириллическая и глаголическая азбуки.

    презентация [501,6 K], добавлен 24.12.2011

  • Латинский язык как один из наиболее древних письменных индоевропейских языков и основа письменности многих современных языков. Основные этапы, характерные с точки зрения внутренней эволюции латинского языка и его взаимодействия с другими языками.

    реферат [17,4 K], добавлен 03.12.2010

  • Факторы речевой организации текста. Характеристика текста как особой речевой единицы. Основные типы текстов. Построение текстов различных стилей. Особенности построения текстов в научном, публицистическом, официально-деловом и художественном стилях.

    курсовая работа [46,9 K], добавлен 22.05.2015

  • Особенности грамматических категорий латинского языка. Времена, формы, наклонение, залог и лицо глаголов. Количественные и порядковые числительные: особенности склонений и согласование с существительными. Пример перевода текста с латинского языка.

    контрольная работа [8,0 K], добавлен 25.05.2009

  • Значение письма в истории развития цивилизации. Происхождение письменности, этапы эволюции письма. Славянский книжный язык. Азбука Константина и кириллическое письм. Славянская письменность и азбучная молитва. Происхождение и цифровая система глаголицы.

    реферат [561,4 K], добавлен 21.10.2010

  • Понятие и специфика композиции, сферы применения данного термина. Композиционная структура текста документа. Требования к композиции документа и порядок ее формирования, сущность рубрикации. Правила разбивки текста. Варианты организации текста письма.

    контрольная работа [36,8 K], добавлен 15.10.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.