如何在 Linux 中获取和更改 PDF 元数据
PDF 元数据包含作者、主题、创建者、制作者和关键字等信息。此信息嵌入到 PDF 文件本身中,如果用户需要确定文档的发布者,或者想要查看使用什么应用程序创建文档等,则可以检索该信息。关键字还可以帮助按类别组织 PDF 文档如果您有很多 PDF 文件。
在本教程中,您将了解如何在 Linux 系统上获取和更改 PDF 元数据。这可以通过命令行和 GUI 来完成。我们将在下面介绍这两种方法。
在本教程中您将学习:
如何从 GUI 获取和更改 PDF 元数据
如何从命令行获取和更改 PDF 元数据
如何从 GUI 获取和更改 PDF 元数据
任何 PDF 编辑器都应该能够获取和更改文件的元数据。 Master PDF Editor 就是这样的一个例子,它在 Linux 上免费提供。
您可以参阅我们关于 Master PDF Editor Linux Installation 的其他教程,以在您的系统上安装该应用程序。
在 Master PDF Editor 中,导航至“文件”>“属性”。
在“文档信息”选项卡下,您将看到 PDF 文件的所有元数据。
如果您想更改任何元数据,只需在此窗口中进行编辑,然后按“确定”保存即可。新的元数据将写入 PDF 文件。要删除元数据,只需退格此处的内容,然后按“确定”。
如何从命令行获取和更改 PDF 元数据
ExifTool 是一个类似命令的程序,可以获取和更改 PDF 元数据。您可以使用下面适当的命令通过系统的包管理器安装 ExifTool。
要在 Ubuntu、Debian 和 Linux Mint 上安装 ExifTool:
$ sudo apt install libimage-exiftool-perl
要在 Fedora、CentOS、AlmaLinux 和 Red Hat 上安装 ExifTool:
$ sudo dnf install perl-Image-ExifTool
要在 Arch Linux 和 Manjaro 上安装 ExifTool:
$ sudo pacman -S perl-image-exiftool
要查看 PDF 文件的所有元数据,请使用
exiftool
命令并指定 PDF 文档的名称。$ exiftool document.pdf
要获取特定的元数据(例如作者),请在命令中指定选项:
$ exiftool -Author document.pdf Author : Canonical
要更改字段的元数据,请使用以下命令语法。这将更改作者字段。
$ exiftool -Author="linuxconfig" document.pdf 1 image files updated
输出表明图像文件已更新,因为 ExifTool 主要用于处理图像,但不用担心,它也会对 PDF 文档进行更改。
要清除字段的元数据,只需用空数据覆盖它即可。以下是我们删除主题字段的方法。
$ exiftool -Subject= document.pdf 1 image files updated
要清除 PDF 文件中所有字段的元数据,请使用以下语法。
$ exiftool -all= document.pdf
结束语
在本教程中,我们了解了如何在 Linux 系统上获取和更改 PDF 元数据。其中包括使用 Master PDF Editor 的 GUI 方法和使用 ExifTool 的命令行方法。请记住,从 PDF 文件中完全清除元数据可能很棘手,并且旧的元数据通常可以恢复。