public interface SequenceSet extends Collection<Sequence>, Serializable, Representable
Наблюдаемые и скрытые последовательности представляются в виде байтовых массивов. Каждый элемент массива отвечает отдельному наблюдаемому или скрытому состоянию; соответствие между целочисленным представлением состояний и их смыслом в рамках предметной области определяется с помощью алфавитов наблюдаемых и скрытых состояний. Алфавит представляет собой строку, каждый символ которой должен быть уникальным и обозначать одно из состояний, определяемых предметной областью. Полные состояния также могут быть представлены алфавитом, однако это представление не является обязательным.
Пример. Для задачи распознавания фрагментов генов:
A), цитозину (C),
гуанину (G) и тимину (T). Алфавит наблюдаемых состояний — строка
"ACGT".
x)
и интронам (i); таким образом, алфавит скрытых состояний — строка "xi".
(A,x) == A), а соответствующие интронам
— прописными ((T,i) == t).
Хранилище set, состоящее из единственной строки полных состояний "ACg"
(нуклеотид аденин, относящийся к экзону, нуклеотид цитозин, относящийся к экзону, а также нуклеотид гуанин,
относящийся к интрону), удовлетворяет следующим свойствам:
assert(set.length() == 1);
assert(set.observedStates().equals("ACGT"));
assert(set.hiddenStates().equals("xi"));
assert(set.completeStates().equals("ACGTacgt"));
assert(Arrays.equals(set.observed(0), new byte[] { 0, 1, 2 }));
assert(Arrays.equals(set.hidden(0), new byte[] { 0, 0, 1 }));
| Modifier and Type | Interface and Description |
|---|---|
static interface |
SequenceSet.Filter
Интерфейс, используемый для фильтрации набора последовательностей.
|
| Modifier and Type | Method and Description |
|---|---|
String |
completeStates()
Возвращает алфавит полных состояний.
|
SequenceSet |
filter(boolean[] selector)
Фильтрует набор последовательностей в соответствии с заданным индикатором вхождения.
|
SequenceSet |
filter(SequenceSet.Filter filter)
Фильтрует набор последовательностей в соответствии с заданным фильтром.
|
Sequence |
get(int index)
Возвращает из выборки прецедент с заданным номером.
|
byte[] |
hidden(int index)
Возвращает строку скрытых состояний с заданным номером.
|
String |
hiddenStates()
Возвращает алфавит скрытых состояний.
|
String |
id(int index)
Возвращает идентификатор для наблюдаемой строки с заданным номером.
|
SequenceSet |
join(SequenceSet other,
SequenceSet... more)
Создает выборку путем слияния нескольких выборок.
|
byte[] |
observed(int index)
Возвращает строку наблюдаемых состояний с заданным номером.
|
String |
observedStates()
Возвращает алфавит наблюдаемых состояний.
|
void |
saveToFile(String filename)
Сохраняет набор последовательностей в файл.
|
int |
size()
Возвращает количество строк наблюдаемых (или скрытых) состояний, помещенных в хранилище.
|
add, addAll, clear, contains, containsAll, equals, hashCode, isEmpty, iterator, remove, removeAll, retainAll, toArray, toArrayreprint size()
size in interface Collection<Sequence>byte[] observed(int index)
index - индекс (с отсчетом от нуля) последовательности наблюдаемых состояний
в этом набореbyte[] hidden(int index)
index - индекс (с отсчетом от нуля) последовательности скрытых состояний
в этом набореString id(int index)
index - индекс (с отсчетом от нуля) последовательности наблюдаемых состояний
в этом набореnullSequence get(int index)
index - номер прецедента (с отсчетом от нуля)String observedStates()
String hiddenStates()
String completeStates()
null. Вначале перечисляются все состояния, скрытая часть которых
равна первому скрытому состоянию, возвращаемому hiddenStates(); порядок
перечисления определяется наблюдаемой частью состояний и совпадает с их порядком
в алфавите observedStates(). Затем перечисляются все полные состояния
со скрытой частью, равной
this.hiddenStates().charAt(1)и так далее.
null, если алфавит полных состояний не определенSequenceSet join(SequenceSet other, SequenceSet... more)
other - множество, которое добавляется к выборкеmore - дополнительные множестваSequenceSet filter(boolean[] selector)
selector - массив булевых величин, определяющий для каждой пары наблюдаемой и соответствущей
скрытой строк в исходном наборе, будут ли они входить в отфильтрованный набор.
Длина массива не должна быть меньше размера исходного набора.SequenceSet filter(SequenceSet.Filter filter)
filter - фильтр, определяющий вхождение пар наблюдаемых и скрытых строк из исходного набора
в новый наборvoid saveToFile(String filename) throws IOException
filename - имя файла, в который производится сохранениеIOException - если в процессе сохранения проихошла ошибка ввода/вывода