您的位置首页 > 数码极客

如何实现网页上编辑文本—如何对网页进行编辑…

鲁达发布于 2023-06-21

文本处理其实是一个很大的题目，无法用文本处理这个名字来概括，从这里这一章开始，我们直接用子项目名做名称。

关键词：html代码

下面我们开始一个新的内容，就是从网页代码的文本文件中提取文字。网页代码，我们一般也叫他html代码。

下面我们有一个文本文件，内容如下

内容很长很长，我们仅仅取出一个屏幕，能做范例就好。

下面的题目是，从这个代码文件中，我们提取出要看的内容。为此，我们编写一个程序做个练习。这个程序的名字叫《网页代码中提取文字.py》。

先开始做第一件事，在不做任何修改的情况下，直接读取文本文件的内容。

于是我们编写了下面一个程序

阅读过前面文章的人，这个程序一看就懂，不用再解释了。运行后，显示效果如下

如果让我们从这段代码中读出里面的中文内容，我相信是非常困难的。

下面研究的课题就是，把中间有用的中文部分内容挑选出来，其他的代码部分去掉，还要尽量保持应该保持的段落，最后有条件的话，再把内容进行一下加工，最后保持文章的主体部分。总之，内容多多如何处理呢？

首先，我们将研究第一个问题，了解网页代码的基本知识。看下图

第一张图片，是一个网页的基本框架。第二张图片，我们对他进行了标注，绿色部分是网页的头部信息，红色部分是网页中的实质内容。黄色的圈圈，就是网页的全部代码。

网页的代码通常用尖括号把它标注出来，他有很多的特殊符号，本格式如下

<html></html>这两个是匹配的，中间就是网页代码具体的内容。

<body></body>这两个也是匹配的，中间是代码中文章体内容的具体部分。

<p></p>这两个也是匹配的，中间是文章段落的具体部分。

HTML语言，大部分内容都是这样配对的，个别的不配对。

由于内容实在太多，我们仅做最简单的介绍。只要掌握一个规律就可以啦，这个规律就是，代码一般都是用尖括号括起来的。

需要说明的是，网页代码我们可以随便打开一个网页，查看源代码就可以看到。我们研究的是通过取出文字的内容来研究文本处理的方法。

1.内容基于多重复合算法人工智能语言模型创作，旨在以深度学习研究为目的传播信息知识，内容观点与本网站无关，反馈举报请点击此处；
2.仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告，请读者放心使用！

“如何实现网页上编辑文本,如何对网页进行编辑,如何编辑网页上的内容,如何把网页文字进行编辑”边界阅读

java项目如何在个人网站上展示相关介绍,本章讲解的是MyBatis 3框架,此框架的主要作用就是更加便携地操作数据库,比如可以将ResultSet对象返回的数据自动封装进Entity实体类或List中,可以把SQL语句配置到XML文件中,也

vv0手机如何下载App,如何下载小视频到手机,苹果手机如何下载相关介绍,IT之家（www.i）：简约就是美好：vivo Funtouch OS 2.0系统体验 10月20日vivo发布了Funtouch OS 2.0公测版。虽然目前仅支持vivo Xshot系列，但笔者从

iphone如何添加股票,iphone股票如何添加恒生指数,iphone股票如何添加上证指数相关介绍,苹果市值从一万亿到两万亿，花了两年时间，这次从两万亿到三万亿，只花了一年零五个月。与此同时，苹果股价涨幅也同样达到了惊人的252%。空前亮眼的财务数据成为支撑苹果公司在金融市场称王的关键原因。在

摩托罗拉z2如何双清,摩托罗拉双清教程,摩托罗拉z2双清教程相关介绍,曾经两河流域上璀璨的明珠，现在的人间炼狱。据资料显示在1980年前后，伊拉克的人均收入在5500美元左右（高居世界第二），而当时中国只有190美元，但是经过“世界警察”两次狂轰滥炸之后，伊拉克一下回到

python如何查看字节r,Python的浮点数占几个字节,python查看字节长度相关介绍,Allison 是 Dropbox 的工程师，在那里她维护着这个世界上最大的 Python 客户端网络之一。在去 Dropbox 之前，她是 Recurse Center 的协调人, 是这个位于纽约的

如何判断是否喜欢it行业相关介绍,很多外行人都会觉得IT行业就是吃青春饭，到了三十岁之后就要转行，其实，这也只是外行人给下的定义，到底IT开发是不是青春饭也要你自己来判断，不要被别人的三言两语就否定了自己，从而影响自己的职业发展。那么

如何停掉gitforwindows,如何停掉医保,如何停掉脑袋里面的歌相关介绍,在使用Git前我们需要先安装 Git。Git 目前支持 Linux/Unix、Solaris、Mac和 Windows 平台上运行。 Git 各平台安装包下载地址为： Linux 平台上安装 Git

如何检查手机电池是新换的,如何检查手机电池是否原装,如何检查手机电池健康相关介绍,电池健康是苹果公司在 iOS11.3 版本后新增的一项显示数据，目的是为了使用户可以更直接的了解关于电池容量、峰值性能以及电池是否需要维修等信息。但对于大多数使用 iPhone 的用户来说，应该或多或