This processor consumes a byte array of the contents of a PDF document and emits a stream of the text contents of that document, page by page

Class names

scala: code.model.flows.processors.pdf.PdfIndexerScannable

javascript: code_model_flows_processors_pdf_PdfIndexerScannable

Aliases

pdf_text_extractor

Input type

code.model.flows.processors.pdf.PdfFile

Output type

code.model.flows.processors.pdf.PdfPage

Config

{"categories":[],"fieldName":"pdf_text_extractor","fields":[{"default":null,"fieldName":"pdf_text_extractor.name","hidden":false,"hideLabel":false,"name":"name","readonly":false,"renderStrategies":[],"type":"S","validators":[]},{"default":"T1726099538831_F1639379861230RT3YMT","fieldName":"pdf_text_extractor.id","hidden":false,"hideLabel":false,"name":"id","readonly":false,"renderStrategies":[],"type":"S","validators":[]},{"default":"pdf_text_extractor","fieldName":"pdf_text_extractor.classPath","hidden":false,"hideLabel":false,"name":"classPath","readonly":false,"renderStrategies":[],"type":"S","validators":[]}],"hidden":false,"hideLabel":false,"name":"pdf_text_extractor","readonly":false,"renderStrategies":[],"type":"O"}

pdf_text_extractor (PDF Indexer)

Class names

Aliases

Input type

Output type

Config