如何在 Linux 上将 PDF 文件转换为文本文档如何在 Linux 上将 PDF 文件转换为文本文档如何在 Linux 上将 PDF 文件转换为文本文档如何在 Linux 上将 PDF 文件转换为文本文档
  • 文章
  • 正则表达式
    • 工具
  • 登录
找到的结果: {phrase} (显示: {results_count} 共: {results_count_total})
显示: {results_count} 共: {results_count_total}

加载更多搜索结果...

搜索范围
模糊匹配
搜索标题
搜索内容
发表 admin at 2025年2月28日
类别
  • 未分类
标签

如何在 Linux 上将 PDF 文件转换为文本文档

编辑 PDF 文件需要先将其转换为文本文档。但你如何做到这一点呢?

与文本文件不同,您无法直接编辑 PDF。使用文本生成 PDF 文件的方法有多种。但是,如果您想反过来将 PDF 转换为文本文件怎么办?

幸运的是,Linux 允许您从终端轻松修改这些文件。本文将演示如何在 Linux 上将 PDF 文件转换为文本文档。

从终端将 PDF 转换为文本

Poppler 是一个用于渲染和修改 PDF 文件的软件库。它包含一个名为 pdftotext 的实用程序,允许用户从 PDF 生成文本文件。由于poppler-utils不是标准 Linux 软件包的一部分,因此您必须使用软件包管理器手动安装它。

在 Ubuntu 和 Debian 上:

sudo apt install poppler-utils

要在 Arch Linux 上安装 Poppler:

sudo pacman -S poppler

在 CentOS、Fedora 和其他基于 RHEL 的发行版上安装 poppler-utils 软件包非常简单。

sudo dnf install poppler-utils
sudo yum install poppler-utils

将整个 PDF 转换为文本

pdftotext 命令的基本语法是:

pdftotext [options] pdffile textfile

...其中 pdffile 是 PDF 文件的绝对或相对路径,textfile 是输出文件的名称。

例如,要将 lorem-ipsum.pdf 转换为文本文件:

pdftotext lorem-ipsum.pdf text.txt

如果您要转换的文件有水印或未对齐的文本,您可以使用 -nodiag 标志在输出中丢弃它们。

pdftotext -nodiag lorem-ipsum.pdf random.text

处理特定范围内的页面

如果要转换特定范围内的页面,请使用 -f 和 -l 标志。例如,要将 lorem-ipsum.pdf 中的第一页到第五页转换为文本:

pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt

仅转换 PDF 文件的第一页:

pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt

将受密码保护的 PDF 文件转换为文本

Pdftotext 甚至可以将受密码保护的 PDF 转换为文本文件。 -upw 和 -opw 标志分别代表用户密码和所有者密码,负责管理转换 PDF 文件时的身份验证过程。

pdftotext -upw password lorem-ipsum.pdf output.txt
pdftotext -opw password lorem-ipsum.pdf output.txt

确保将密码替换为 PDF 文件的密码。

您还可以组合多个标志以获得所需的输出。例如,要将受密码保护的 PDF 的第一页到第三页转换为文本:

pdftotext -f 1 -l 3 -upw password lorem-ipsum.pdf output.txt

以图形方式将 PDF 转换为文本文件

如果您不喜欢使用命令行,您可以使用 Calibre 等图形软件将 PDF 转换为文本文件。它是一款电子书管理应用程序,可用于在系统上查看、组织和修改 PDF 文件。

Calibre 可在官方 Linux 发行版存储库中找到,任何人都可以使用包管理器下载它。

要在 Ubuntu 和 Debian 上安装 Calibre:

sudo apt install calibre

在 Arch Linux 上:

sudo pacman -S calibre

在基于 RHEL 的发行版(例如 CentOS 和 Fedora)上,您可以使用 DNF 或 Yum 下载 Calibre。

sudo dnf install calibre
sudo yum install calibre

如何使用 Calibre 转换 PDF 文件

安装后,使用应用程序菜单在您的系统上启动 Calibre。或者,您可以通过键入以下内容从终端启动 Calibre:

calibre

要使用 PDF 和 Calibre 生成文本文件:

  1. 单击菜单中的添加图书选项。

  2. 找到并选择您要转换的 PDF 文件。

  3. 从中心面板突出显示 PDF 文件,然后从菜单中选择转换图书。

  4. 从输出格式下拉列表中,选择TXT。

  5. 最后,单击确定继续。

Calibre 现在将开始将指定的 PDF 文件转换为文本文档。您可以通过单击窗口右下角的作业选项来检查流程的状态。

在 Linux 中处理 PDF 文件

当您想与某人共享文档时,在共享之前将其转换为 PDF 是最有效的方法。以前,用户必须在系统上安装专用的 PDF 查看器才能显示 PDF 文件,但现在,几乎每个浏览器都配备了内置的 PDF 查看器。

您可以找到多种允许用户轻松查看和编辑 PDF 文件的应用程序。许多 Linux 安装都附带 LibreOffice,这是一种办公软件套件,可以用作 PDF 编辑器。

©2015-2025 艾丽卡 support@alaica.com