masterspammer (masterspammer) wrote,
masterspammer
masterspammer

Category:

Грибное дерево или префиксные эльфы

В общем, тот вариант сжатия хорош в случае большого оканчивающихся слов - новый|ая|ое, хреновый|ая|оя и т.д., когда дерево порастает такими типовыми веточками. Если же слова вносить наизнанку - от последней буквы к первой, то все эти веточки-окончания лягут в основание дерева и их не надо будет вообще как-то сжимать - если окончание "ое" одно на 1000 слов, то оно 1 раз и будет храниться.

Другое дело - приставки и вообще типовые окончания. Они конечно тоже достаточно типовые, чтоб сжатие работало лучше, чем его отсутствие; но не настолько, чтоб так же хорошо работало. Для этого есть особое дерево - для типовых последовательностей без ответвлений хранящее одну ветвь без всей цепочки последовательности узлов; если применить "сигнатуры" как в прошлой записи, то они будут таките

+1,ИЕРП1 - например, летел и прилетел
+0,ОГ1 - голова, государство, гонец

Скорее всего, я не буду обрабатывать сигнатуры вида

+1,АЗ1,ИЕРП1 - летел, залетел и прилетел

а сведу их к двум описаным выше вариантам - или несколько разных однобуквенных ветвей или одна многобуквенная; надеюсь, это даст требуемое сжатие, ну а нет - буду думать.
Tags: Обломы, ТекстовыеАлгоритмы, Философское
Subscribe

  • Алдан

    Кажется, я знаю, как назвать своё "произведение" на Z80; про идею я писал несколько раз, а кратко это: 1. "системный" режим,…

  • (no subject)

    В общем, загад (вот гад!) не бывает богат. Из запланированного сделал абсолютный минимум. Эпиграфом субботы был анекдот про лягушку, ходившую по…

  • Монитороложество

    Ковыряю телек - хочу отделить монитор. Прозвонил что куда - всё На плате - микросхема toshiba 203g04f0004, её описания нигде нет, только вот…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 4 comments