Skip to content

c7nw3r/datariot

Repository files navigation

problem with pdfplumber version > 11 bounding box reihenfolge unterschiedlich

pdfplumber auf version 0.10.4 festgelegt, weil version 0.11.0 in der Funktion extract_words( extra_attrs=config.extract_words_extra_attrs, keep_blank_chars=config.extract_words_keep_blank_chars, x_tolerance=config.parser_x_tolerance, y_tolerance=config.parser_y_tolerance ) die zurückgegebene box-Reihenfolge nicht sortiert, sobald der parameter "extra_attrs" befüllt ist. Das führt dazu dass Textboxen falsch gemerged werden.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Contributors 2

  •  
  •