text

Type Members

sealed abstract class Language extends EnumEntry with Serializable

Language enum
trait LanguageDetector extends Serializable

Language detector trait
class LuceneHtmlStripTextAnalyzer extends LuceneTextAnalyzer

Text analyzer implementation using a Lucene analyzer with HTML stripping applied
class LuceneRegexTextAnalyzer extends LuceneTextAnalyzer

Text analyzer implementation using a Lucene analyzer with Pattern Tokenizer matching
class LuceneTextAnalyzer extends TextAnalyzer

Text analyzer implementation using a Lucene analyzer
trait NameEntityTagger[Result <: TaggerResult] extends Serializable

Interface for Name Entity Recognition tagger

Interface for Name Entity Recognition tagger

Result

result of the NameEntityTagger.tag function call
sealed trait NameEntityType extends EnumEntry with Serializable

Name Entity Recognition entity type
class OpenNLPAnalyzer extends TextAnalyzer

OpenNLP text analyzer to apply when applying Open NLP TokenNameFinderModel
class OpenNLPNameEntityTagger extends NameEntityTagger[OpenNLPTagResult]

OpenNLP implementation of NameEntityTagger
class OpenNLPSentenceSplitter extends SentenceSplitter

Implementation of SentenceSplitter using Open NLP sentence splitter
case class OpenNLPTagResult(tokenTags: Map[String, Set[NameEntityType]]) extends TaggerResult with Product with Serializable

OpenNLP implementation of TaggerResult

OpenNLP implementation of TaggerResult

tokenTags

token tags map, where keys are token and values are entities matching each token
class OptimaizeLanguageDetector extends LanguageDetector

Language detector implementation using Optimaize/language-detector library https://github.com/optimaize/language-detector
trait SentenceSplitter extends Serializable

Interface for Sentence Splitter that allows detecting and splitting text into separate sentences.
trait TaggerResult extends Serializable

Result of NameEntityTagger.tag function call
trait TextAnalyzer extends Serializable

Text analyzer trait

Value Members

object Language extends Enum[Language] with Serializable

Language enum with entryName is ISO 639-1 or 639-3 language code, eg "fr" or "gsw"
object LuceneTextAnalyzer extends Serializable

Creates a Lucene Analyzer for a specific language or falls back to StandardAnalyzer
object NameEntityType extends Enum[NameEntityType] with Serializable

Name Entity Recognition entity type
object OpenNLPModels

A factory to get/create OpenNLP models
object TextUtils extends Product with Serializable

package text

Type Members

sealed abstract class Language extends EnumEntry with Serializable

trait LanguageDetector extends Serializable

class LuceneHtmlStripTextAnalyzer extends LuceneTextAnalyzer

class LuceneRegexTextAnalyzer extends LuceneTextAnalyzer

class LuceneTextAnalyzer extends TextAnalyzer

trait NameEntityTagger[Result <: TaggerResult] extends Serializable

sealed trait NameEntityType extends EnumEntry with Serializable

class OpenNLPAnalyzer extends TextAnalyzer

class OpenNLPNameEntityTagger extends NameEntityTagger[OpenNLPTagResult]

class OpenNLPSentenceSplitter extends SentenceSplitter

case class OpenNLPTagResult(tokenTags: Map[String, Set[NameEntityType]]) extends TaggerResult with Product with Serializable

class OptimaizeLanguageDetector extends LanguageDetector

trait SentenceSplitter extends Serializable

trait TaggerResult extends Serializable

trait TextAnalyzer extends Serializable

Value Members

object Language extends Enum[Language] with Serializable

object LuceneTextAnalyzer extends Serializable

object NameEntityType extends Enum[NameEntityType] with Serializable

object OpenNLPModels

object TextUtils extends Product with Serializable

Ungrouped