bugfix> python > 投稿

私は pyPDF2 で運がありませんまたは PDFMiner 。ツールは常に _______________ を返しますテキストボックスが入力されていても、テキストボックスのフィールド内のテキストを抽出する方法について誰か考えがありますか?

回答 1 件
  • テキストではなく、テキストフィールドを抽出する必要があります。したがって、次のようなものが必要です。

    import sys
    import six
    from pdfminer.pdfparser import PDFParser
    from pdfminer.pdfdocument import PDFDocument
    from pdfminer.pdftypes import resolve1
    fp = open("c:\\tmp\\test.pdf", "rb")
    parser = PDFParser(fp)
    doc = PDFDocument(parser)
    fields = resolve1(doc.catalog["AcroForm"])["Fields"]
    for i in fields:
        field = resolve1(i)
        name, value = field.get("T"), field.get("V")
        print ("{0}:{1}".format(name,value))
    
    

あなたの答え