masterspammer (masterspammer) wrote,
masterspammer
masterspammer

Category:

Грибное дерево или префиксные эльфы

В общем, тот вариант сжатия хорош в случае большого оканчивающихся слов - новый|ая|ое, хреновый|ая|оя и т.д., когда дерево порастает такими типовыми веточками. Если же слова вносить наизнанку - от последней буквы к первой, то все эти веточки-окончания лягут в основание дерева и их не надо будет вообще как-то сжимать - если окончание "ое" одно на 1000 слов, то оно 1 раз и будет храниться.

Другое дело - приставки и вообще типовые окончания. Они конечно тоже достаточно типовые, чтоб сжатие работало лучше, чем его отсутствие; но не настолько, чтоб так же хорошо работало. Для этого есть особое дерево - для типовых последовательностей без ответвлений хранящее одну ветвь без всей цепочки последовательности узлов; если применить "сигнатуры" как в прошлой записи, то они будут таките

+1,ИЕРП1 - например, летел и прилетел
+0,ОГ1 - голова, государство, гонец

Скорее всего, я не буду обрабатывать сигнатуры вида

+1,АЗ1,ИЕРП1 - летел, залетел и прилетел

а сведу их к двум описаным выше вариантам - или несколько разных однобуквенных ветвей или одна многобуквенная; надеюсь, это даст требуемое сжатие, ну а нет - буду думать.
Tags: Обломы, ТекстовыеАлгоритмы, Философское
Subscribe

  • Техноорки

    Началось с того, что у жены в машине начал часто загораться индикатор аккумулятора и иногда возникать глюки зажигания на полной нагрузке…

  • Заусенец

    Переклеил, ага, но что-то чуйка не даёт считать дело законченным. Магнит купил, определил и подписал полюса, плюсы и минуса. Парный динамик уже…

  • Криворучие и около того

    Сначала средний сын взял недопаянную плату памяти и завернул все торчавшие проводки свиным хвостом ( по ссылке предыдущее состояние, потом проводков…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 4 comments