适用于 Linux 的最佳命令行 Web 工具
网络是图形化的;你因旧习惯而哭泣。这正是大多数网站的设计初衷。我们都知道它以一种称为 HTML 的文档格式开始!按照当今网站的工作方式,我们可能会认为所有内容都是图像、视频和令人难以置信的动画,更不用说猫了。这意味着需要大量、复杂的网络浏览器才能找到哪怕是最微小的信息碎片。您最喜欢的浏览器在您的系统中占有重要地位,您必须在线才能阅读它。但它不一定是这样的。
为什么使用命令行?
事实略有不同;网页(甚至 YouTube)上的大部分信息都是基于文本的。您可以使用它来查找和过滤数据以满足您的需求。最重要的是,如果您想避免跟踪,最好考虑离线阅读许多网页。另一个原因是收集抓取项目的信息。抓取网页意味着通过软件(通常是机器学习)找到所需的信息来得出结论。如果您需要解决编程问题的帮助,这些网站可以与基于文本的浏览器一起使用,因此如果您需要它们,您可以留在命令行上。
浏览器
仍在维护的最古老的命令行浏览器是 Lynx。它有许多优秀的功能,但没有 JavaScript。虽然您可以使用 StackExchange,但该网站使用 Javascript 效果更好。在撰写本文时,无法使用您的 Google 或 Facebook 帐户登录。浏览器在屏幕底部有一个小信息栏,没有菜单。 Links2 顶部有一个下拉菜单,您可以通过按退出键调用该菜单。否则,大多数操作与 Lynx 相同;最大的区别是链接也可以在图形模式下工作。在大多数系统中,您应该从应用程序列表中调用它以进入图形模式。在图形模式下运行浏览器是相同的。
elinks 是两个早期浏览器的增强版。该浏览器非常引人注目,甚至可以通过外部查看器支持图像。该查看器非常适合休闲浏览,并且比其他查看器保留更多内容。一件事是你可以通过一些调整工作来运行 JavaScript。它不会开箱即用。
构建 W3M 的设计者考虑的不仅仅是网页浏览。 w3m 浏览器也是一个寻呼机,可以使用它查看图像等内容。您可以使用它作为文本格式化工具来排版 html 页面。它配备了一个图像查看器,可以查看多种格式的图像。许多其他程序使用它来在其终端程序中显示图像。
W3m 在 emacs-w3m 中有一个表弟。这个漂亮的软件可以在 emacs 内浏览网页;谁离开?它使用 w3m 来渲染页面。作为emacs,安装是常规的;将所需的语句放入您的配置中。但是,它还需要安装 w3m 二进制文件。
下载工具
除了想要在终端中浏览之外,您可能还想下载文件并单独处理它们。这对于加快下载速度非常有用,而且很多时候您可以绕过地理锁定。如果您正在寻找媒体文件,您可以下载代码并使用 grep、tail 和 表兄弟进行搜索。
您应该了解的第一个工具是 wget2,第二个!该工具可以下载一个文件,但也可以下载多个文件。该命令最有价值的部分是它可以镜像网站。执行此操作时,您还可以设置以下网站外链接的级别。这些下载可能需要很长时间,因此您可以选择在后台运行它们。如果您遇到带宽问题,您还可以限制您使用的带宽。如果您有出色的带宽,请考虑 puf,它可以并行下载文件。
您可以使用 cURL 下载文件,但与 wget 的最大区别在于 cURL 使用代码打开站点。如果您在不带选项的任意站点上运行它,您将看到 HTML 代码。一些地区已经利用了这一点;如果你打开它们,你会得到最终结果。一个很好的例子是 wttr.in,如果将您的位置添加为目录 (curl wttr.in/Stockholm)。该命令还具有许多针对 Python、Rust、PHP 等程序语言的扩展。
如果您有自己的服务器并且需要传输文件,请使用 sftp。这是安全的,并且应该是在系统之间移动您自己的文件的唯一方法。客户端是 ssh(安全 shell 系统)的一部分。您使用 ssh 登录远程服务器。
结论
无论您做什么,请考虑使用图形 Web 浏览器是否是上网的唯一方式。大多数网站在命令行上看起来很奇怪,但通常情况下,您可以获得所需的信息。有些甚至可以在命令行中显示图形。与您习惯的旧版浏览器相比,它们对资源的需求要小得多。在了解其用法和功能后,通过网络处理文件的工具会变得非常强大。您还可以将它们用于您的编程项目,特别是带有库和与编程语言的许多连接的 cURL。