Package ua.kiev.icyb.bio

Пакет, содержащий классы и интерфейсы, формализующие основные понятия для алгоритмов распознавания скрытых последовательностей.

See: Description

Package ua.kiev.icyb.bio Description

Пакет, содержащий классы и интерфейсы, формализующие основные понятия для алгоритмов распознавания скрытых последовательностей.

Постановка задачи распознавания

Задача распознавания скрытых последовательностей возникает, в частности, в двух задачах биоинформатики: распознавании генов и предсказании вторичной структуры белка:

Задача. По заданной последовательности нуклеотидов гена определить их принадлежность структурным фрагментам — экзонам и интронам.

Задача. По заданной последовательности аминокислот, составляющих белок, определить их принадлежность пространственным структурам.

Эти задачи допускают общую формулировку:
Задача. По заданной последовательности наблюдаемых состояний определить соответствующую им последовательность скрытых состояний (i-е скрытое состояние соответствует i-му наблюдаемому состоянию), которая максимизирует определенный критерий качества.

Полные состояния

Полным состоянием называется упорядоченная пара из наблюдаемого и соответствующего ему скрытого состояния. Так, для задачи распознавания фрагментов генов отдельное полное состояние включает в себя информацию о каком-то нуклеотиде и его принадлежности экзону или интрону. Задача оптимизации в терминах полных состояний имеет следующий вид:
Задача. Восстановить строку полных состояний, которая имеет заданную наблюдаемую часть и оптимизирует определенный критерий качества.