int nProcessed
boolean[] isUnprocessed
RunCollection parent
int runIndex
PredictionQuality quality
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException
IOExceptionClassNotFoundExceptionprivate void writeObject(ObjectOutputStream out) throws IOException
SeqAlgorithm.clearClone(),
то есть сохраняются исключительно управляющие параметры алгоритма, но не параметры,
полученные в результате обучения на прецедентах.IOExceptionboolean skipTraining
byte[] foldIndex
SequenceSet set
AlgorithmRun[] runs
PredictionQuality meanTraining
PredictionQuality meanControl
int sequencesPerSave
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException
NamedSequenceSet.NamedSequenceSet(String, Env),
сохраняется строка — аргумент этого конструктора.
src,
сохраняется исходный набор src и массив булевых величин,
характеризующий вхождение строк из него в отфильтрованный набор.
IOExceptionClassNotFoundExceptionString datasetName
NamedSequenceSet unfilteredSet
null.boolean[] selector
null.SequenceSet[] setParts
String hiddenStates
int[] truePos
int[] trueNeg
int[] falsePos
int[] falseNeg
int[] trueRegion
int[] actRegion
int[] prRegion
int nSeq
int nDeniedSeq
PredictionQuality[] samples
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException
IOExceptionClassNotFoundExceptionprivate void writeObject(ObjectOutputStream out) throws IOException
IOExceptionSequenceSet trainingSet
SequenceSet controlSet
AlgorithmRun run
int sequencesPerSave
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException
IOExceptionClassNotFoundExceptionprivate void writeObject(ObjectOutputStream out) throws IOException
IOExceptionList<E> hiddenSeq
List<E> observedSeq
List<E> ids
String observedStates
String hiddenStates
String completeStates
boolean writeContent
int order
int minOrder
Approximation.Strategy strategy
double initThreshold
Approximation.Strategy.FIXED.double transThreshold
Approximation.Strategy.FIXED.double tailP
EmpiricalDistribution.bins.lengthint window
double weightSum
double[] bins
i-й элемент массива равен сумме весов прецедентов,
имеющих значение i.Approximation approx
int minOrder
Approximation.minOrderApproximation.Strategy strategy
Approximation.strategydouble iThreshold
Approximation.initThresholddouble tThreshold
Approximation.transThresholdMarkovChain[] subchains
int observed
int hidden
int length
FragmentFactory factory
String observedStates
String hiddenStates
String completeStates
null).int oSize
int hSize
int[] obsPower
int[] hPower
int[] cPower
int generations
int crossovers
int mutations
int maxSize
double mutationP
Organism.mutate(double)boolean weakCache
WeakHashMap).
Если значение параметра равно false, для кэширования используется
обычная хэш-таблица (класс HashMap).String saveTemplate
{i}
заменяется на номер текущего поколения.Collection<E> initialPopulation
Set<E> population
int generationIdx
boolean populationFormed
Map<K,V> fitness
Double.NaN соответствуют невычисленным значениям.private void readObject(ObjectInputStream stream) throws IOException, ClassNotFoundException
IOExceptionClassNotFoundExceptionprivate void writeObject(ObjectOutputStream stream) throws IOException
IOExceptionint depLength
int order
String observedStates
String hiddenStates
String completeStates
int nSequences
Map<K,V> initial
Map<K,V> transitions
MarkovChain.order в таблице соответствует массив величин, каждая из которых равна взвешенному
числу переходов из этой последовательности в одно из возможных зависимых состояний.
Зависимые состояния упорядочены в алфавитном порядке, определяемом
методом Fragment.index().
Последний элемент массива равен сумме остальных элементов (предназначен для ускорения
вычислений).Distribution<T> lengthDistr
SeqAlgorithm baseAlgorithm
Env env
Distribution<T> base
Env env
MarkovChain chain
int depLength
int order
boolean stochastic
В стохастическом EM-алгоритме на этапе ожидания вместо решения задач максимизации взвешенного правдоподобия решаются задачи максимизации обычного правдоподобия для подмножеств выборки, вероятность входжения в которые для каждого образца выборки равна соответствующей апостериорной вероятности его генерации соответствующей вероятностной моделью. Это делается, чтобы "выбить" алгоритм из точек локальных максимумов.
int nIterations
String saveTemplate
| {n} | количество марковских моделей в композиции; |
|---|---|
| {i} | номер итерации с отсчетом от нуля. |
SequenceSet set
MarkovMixture mixture
Random random
int iteration
EMSelectionMethod selectionMethod
EMSelectionMethodboolean selectWeights
false (значение по умолчанию), для меры качества используется
логарифмическое правдоподобие, нормализованное на длину строки.int indexOffset
1
означает, что в плохие прецеденты будет добавлена еще одна строка с наименьшим значением
меры качества; -10 означает, что из плохих прецедентов будет удалено десять
строк с наибольшими значениями меры качества.double valueOffset
IncrementalEMAlgorithm.selectionMethod.int maxModels
boolean fitInitialMixture
false, алгоритм немедленно приступает к поиску "плохих"
прецедентов.double[] weights
Distribution<T>[] models
MarkovMixture baseMixture
MarkovMixture mixture
SequenceSet set
double[][] weights
Map<K,V> labels
double threshold
FragmentSet bases
String alphabet
int fragmentLength
RuleEntropy entropy
PartitionRule[] rules
int[] parts
i-й элемент которого равен номеру части выборки, которую разбивает
i-е правило.int nRules
int minOrder
int maxOrder
SeqAlgorithm[] algorithms
int maxSize
int optCombinations
int order
SequenceSet set
FragmentSet bases
String setsFile
Map<K,V>[] fitness
i соответствует i-й элемент массива.int currentSize
private void readObject(ObjectInputStream in) throws ClassNotFoundException, IOException
ClassNotFoundExceptionIOExceptionSequenceSet fullSet
int order
boolean countInitials
int treeSize
int order
double[] percentages
0.6 означает, что предикат должен быть
истинен на 60% прецедентов выборки.double minPartSize
SequenceSet set
Collection<E> baseSets
String treeFile
PartitionRuleTree tree
int[] partIdx
Collection<E> computedFitness
double[] maxFitness
Double.NaN означает, что функционал качества
для соответствующей части выборки еще не вычислен.PartitionRule[] optRule
int currentPart
boolean rulesInferred
List<E> partRules
Map<K,V> ruleFitness
Double.NaN обозначает
предикат, для которого функционал качества еще не вычислен.SequenceSet set
PartitionRule rule
double fitness
int iteration
int partitionIndex
boolean isOptimal
boolean isGloballyOptimal
SeqAlgorithm[] algorithms
Map<K,V> labels
PartitionRuleTree tree
SequenceSet set
SequenceSet.Filter baseFilter
SequenceSet filtered
boolean[] selector
Set<E> proteinNames
Set<E> proteinPrefixes
boolean uniqueNames
boolean uniquePrefix
int prefixLength
DSSPReader.uniquePrefix.boolean includeBreaks
SimpleSequenceSet proteins
String[] filenames
BufferedReader reader
SymbolList sourceSequence
boolean uniqueGenes
boolean allowUnknownNts
SequenceSet set
Env env
String filename