初中信息科技 / 义务教育版(2024) / 七年级全一册(2024) / 第三单元 便捷的互联网服务 / 第14课 互联网搜索新发展 / 编号:25611211

互联网搜索新发展(课件)-义务教育信息科技七年级全一册同步教学

日期:2026-05-08 科目:初中信息技术 类型:课件 来源:二一教育课件站
关键词:搜索,网页,搜索引擎,进行,网络,软件
预览图 7
初中信息技术 初中信息技术
(课件网) 互联网搜索新发展 第三单元 便捷的互联网服务 目录 CONTENTS 行业PPT模板http://www./hangye/ 了解搜索引擎的工作原理。 知道搜索引擎的简单工作过程。 了解网络爬虫等自动化技术给搜索带来的影响。 01 02 03 准备读书节线上活动需要收集资料,但是自行在庞大的网络世界中获取信息,无异于大海捞针。网络中有很多专门提供信息搜索服务的网站,它们被称为搜索引擎。 1. 为什么搜索引擎搜得那么快? 2. 搜索系统是如何完成搜索的? 3. 搜索引擎技术发生了哪些改变? 搜索引擎的工作思路 P ART01 互联网上有难以计数的网站,搜索引擎需要从这些网站中寻找与关键词相匹配的网页,然后返回搜索结果,应该需要花费很长时间。但实际上,在搜索引擎中输入问题或关键词后,很快就能看到结果,为什么能搜得这么快? 搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。 学习活动1 实验目的:熟悉搜索引擎的工作过程 实验条件:《简易搜索系统》软件、配套资源中的 Web文件夹 实验步骤: 1. 运行《简易搜索系统》软件,启动搜索服务,然后尝试用关键词“中国探月”进行搜索,查看搜索结果。 2. 把老师提供的 Web 文件夹复制到搜索服务软件所在的文件夹中。 3. 重新运行服务软件后,以“中国探月”为关键词进行搜索 4. 浏览一些网页,并把网页保存到 Web文件夹中。 5. 打开 Web 文件夹中的 pages.csv,记录网页文件的文件名和对应的网址。 6. 继续搜索,看看能否搜到刚刚保存的内容。 实验结论 1. 搜到的信息是( □ 搜索前放进去的 □ 实时在网络中获取的)。 2. 网页数据都保存在:_____ 3. 网页文件跟实际网址的关系,保存在:_____ 4. 参照上图,当前网页排序用的算法是:_____ 5. 梳理搜索系统的结构组成,把下图补充完整。 A E D C B √ Web文件夹 pages.csv 根据关键词出现的次数进行排序,次数越多越靠前 搜索系统的创新改进 P ART02 通过人工操作来扩充搜索系统中的网页数据比较烦琐,有没有办法更高效地完成相关操作呢?如果让计算机替代人工操作,会极大提升工作效率。 例如,用网络爬虫自动获取相关网页以备查询 1. 输入一个网址后单击“启动网络爬虫”按钮,软件就会自动获取相应的网页 2. 覆盖之前的 spider.pyc 文件即可。覆盖后重新运行会发现,界面中多了与网络爬虫相关的组件 3. 输入要自动获取的网址后单击“启动网络爬虫”按钮,软件除了自动获取网址对应的网页,还会尝试依据该网页含有的超链接,再获取几个网页,并自动维护 pages.csv 文件。 4. 引导学生比较两次搜索的结果,观察变化。 5. 用自动化工具代替人工完成了烦琐的操作,提高了效率 拓 展 与 提 升 进一步创新改进搜索系统 1. 运行《分词测试》软件,输入一个短语进行分词,感受分词的效果。 2. 把 tokenizer.pyc 文件复制到搜索系统文件夹中,运行《简易搜索系统》软件,看看搜索结果的变化。 3. 搜索结果是根据关键词出现的次数进行排序的。请思考除了“关键词出现次数”这一指标,还有哪些指标可以让网页排序更精准? 拓 展 与 提 升 4. 参照图畅想一下,还有什么地方可以改进,然后交流讨论技术创新的推动作用。 感谢您的观看 ... ...

~~ 已预览到文档结尾了 ~~