多媒体素材的分类、特点与获取
多媒体素材的分类
一、文本
文本指的是字母、数字和符号,与其他媒体相比,文字是最容易处理、占用存储空间最少、最方便利用计算机输入和存储的媒体。文本显示是多媒体教学软件的非常重要的一部分。多媒体教学软件中概念、定义、原理的阐述、问题的表述、标题、菜单、按钮、导航等都离不开文本信息。它是准确有效地传播教学信息的重要媒体元素。文字是一种常用的媒体元素。
文件格式和特点
.TXT:TXT文本是纯文本文件是无格式的,即文件里没有任何有关字体、大小、颜色、位置等格式化信息。Windows系统的“记事本”就是支持TXT文本的编辑和存储工具。所有的文字编辑软件和多媒体集成工具软件均可直接调用TXT文本格式文件。记事本的功能也很强大,
.DOC:DOC是Word字处理软件所使用的文件格式。
.WPS:WPS是中文字处理软件的格式,其中包含特有的换行和排版信息,它们被称为格式化文本,只能在特定WPS编辑软件中使用。
.RTF:带格式的纯文本文件,Windows系统的“写字板”就是支持rtf文本的编辑和存储工具。
二、图形
计算机中的图形是数字化的,是矢量图,矢量图形是通过一组指令集来描述的,这些指令描述构成一幅图的所有直线、圆、圆弧、矩形、曲线等的位置、维数和大小、形状。显示时需要专门的软件读取这些指令,并将其转变为屏幕上所显示的形状和颜色。矢量图是利用称为Draw的计算机绘图程序产生的。矢量图主要用于线形的图画、美术字、工程制图等。
文件格式和特点
.WMF Windows图元文件格式
.EMF Windows增强性图元文件格式
.CDR CorelDRAW制作生成的.CDR文件文件
三、图像
这里讲的图像指的是位图,它是由描述图像中各个像素点的强度与颜色的数位集合组成的。位图图像适合表现比较细致,层次和色彩比较丰富,包含大量细节的图像。生成位图图像的方法有多种,最常用的是利用绘图的软件工具绘制,用指定的颜色画出每个象素点来生成一幅图形。
文件格式和特点
.BMP BMP(Bitmap的缩写)图像文件是几乎所有Windows环境下的图形图像软件都支持的格式。这种图像文件将数字图像中的每一个像素对应存储,一般不使用压缩方法,因此BMP格式的图像文件都较大,特别是具有24位色深(2的24次方种颜色)的真彩色图像更是如此。由于BMP图像文件的无压缩特点,在多媒体节目制作中,通常不直接使用BMP格式的图像文件,只是在图像编辑和处理的中间过程使用它保存最真实的图像效果,编辑完成后转换成其他图像文件格式,再应用到多媒体项目制作中。
.GIF PNG(Portable Network Graphics)图像文件格式提供了类似于GIF文件的透明和交错效果。它支持使用24位色彩,也可以使用调色板的颜色索引功能。可以说PNG格式图像集中了最常用的图像文件格式(如GIF,JPEG)的优点,而且它采用的是无损压缩算法,保留了原来图像中的每一个像素。
.JPG JPEG图像文件格式采用的是较先进的压缩算法。这种算法在对数字图像进行压缩时,可以保持较好的图像保真度和较高的压缩比。这种格式的最大特点是文件非常小,用户可以根据自己的需要选择JPEG文件的压缩比,当压缩比为16:1时,获得压缩图像效果几乎与原图像难以区分;当压缩比达到48:1时,仍可以保持较好的图像效果,仔细观察图像的边缘可以看出不太明显的失真。因为JPEG图像的压缩比很高,因此非常适用于要处理大量图像的场合。JPEG图像格式是目前应用范围非常广泛的一种图像文件格式。
四、动画
动画是通过一系列彼此有差别的单个画面来产生运动画面的一种技术,通过一定速度的播放可达到画中形象连续变化的效果。要实现动画首先需要有一系列前后有微小差别的图形或图像,每一幅图片称为动画的一帧,它可以通过计算机产生和记录。只要将这些帧以一定的速度放映,就可以得到动画,称为逐帧动画。
在教学中,往往需要利用动画来模拟事物的变化过程,说明科学原理,尤其是二维动画,在教学中应用较多。在许多领域中,利用计算机动画来表现事物甚至比电影的效果更好。因此,较完善的多媒体教学软件都应配有动画以加强教学效果。
文件格式和特点
.FLC Flash源文件存放格式。在Flash中,大量的图形是矢量图形,因此,在放大与缩小的操作中没有失真,它制作的动画文件所占的体积较小。Flash5动画编辑软件功能强大,操作简单,易学易用。
.SWF Flash动画文件格式。
.GIF GIF格式是常见的二维动画格式。
.AVI 严格说来,AVI格式并不是一种动画格式,而是一种视频格式,它不但包含画面信息,亦包含声音效果。因为包含声音的同步问题,因此,这种格式多以时间为播放单位,因此在播放时,不能控制其播放速度。
五、声音
声音通常有语音、音效和音乐等三种形式。语音指人们讲话的声音;音效指声音特殊效果,如雨声、铃声、机器声、动物叫声等等,它可以是从自然界中录音的,也可以采用特殊方法人工模拟制作;音乐则是一种最常见的声音形式。
在多媒体教学软件中,语言解说与背景音乐是多媒体教学软件中重要的组成部分。最常见通常有三类声音,即波形声音、MIDI和CD音乐,而在多媒体教学软件中使用最多的是波形声音。
文件格式和特点
.WAV 波形声音文件格式,波形声音,它是通过对声音采样生成。在软件中存储着在经过模数转换后形成的千万个独立的数码组,数码数据表示了声音在不连续的时间点内的瞬时振幅。
.MID MIDI声音文件格式,MIDI(乐器数字接口)是一个电子音乐设备和计算机的通讯标准。MIDI数据不是声音,而是以数值形式存储的指令。一个MIDI文件是一系列带时间特征的指令串。实质上,它是一种音乐行为的记录,当将录制完毕的MIDI文件传送到MIDI播放设备中去时,才形成了声音。MIDI数据是依赖于设备的,MIDI音乐文件所产生的声音取决于用于放音的MIDI设备。
.MP3 MP3是以MPEG Layer 3标准压缩编码的一种音频文件格式。MPEG编码具有很高的压缩率,我们通过计算可以知道,一分钟CD音质 (44100 Hz,16 Bit,2 Stereo,60 Second)的WAV文件如果未经压缩需要10兆左右的存储空间。MPEG Layer 3的压缩率高达1:12。以往1分钟左右的CD音乐经过MLPEG Layer 3格式压缩编码后,可以压缩到1兆左右的容量,其音色和音质还可以保持基本完整而不失真。
六、视频
视频(Video)与动画一样,由连续的画面组成,只是画面是自然景物的动态图像。视频一般分为模拟视频和数字视频,电视、录像带是模拟视频信息。当图像以每秒24帧以上的速度播放时,由于人眼的视觉暂留作用,我们看到的就是连续的视频。多媒体素材中的视频指数字化的活动图像。VCD光盘存储的就是经过量化采样压缩生成的数字视频信息。视频信号采集卡是将模拟视频信号在转换过程中压缩成数字视频,并以文件形式存入计算机硬盘的设备。将视频采集卡的视音频输入端与视音频信号的输出端(如摄像机、录像机、影碟机等)连接之后,就可以采集捕捉到的视频图像和音频信息。
视频文件是由一组连续播放的数字图像(Video)和一段随连续图像同时播放的数字伴音共同组成的多媒体文件。其中的每一幅图像称为一帧(frame),随视频同时播放的数字伴音简称为“伴音”。
文件格式和特点
.AVI AVI(Audio Video Interleave)是Microsoft公司开发的一种伴音与视频交叉记录的视频文件格式。在AVI文件中,伴音与视频数据交织存储,播放时可以获得连续的信息。这种视频文件格式灵活,与硬件无关,可以在PC机和Microsoft Windows环境下使用。
.VOB DVD视频文件存储格式。
.DAT VCD视频文件存储格式。
.wmvMpeg编码视频文件。
.MPEG 同上。
.RM 实时声音(real audio)和实时视频(real video)是在计算机网络应用中发展起来的多媒体技术,它可以为使用者提供实时的声音和视频效果。Real采用的是实时流 (streaming)技术,它把文件分成许多小块像工厂里的流水线一样下载。用户在采用这种技术的网页上欣赏音乐或视频,可以一边下载一边用Real播放器收听或收看,不用等整个文件下载完才收听或收看。Real格式的多媒体文件又称为实媒体(Real Media)或流格式文件,其扩展名是.RM、.RA或.RAM。在多媒体网页的制作中,已成为一种重要的多媒体文件格式。如果要在网页中使用类似Real格式文件那样的“流式播放”技术,不仅要求浏览器的支持,还需要使用支持流式播放的网页服务器。
.MOV MOV是Apple公司为在Macintosh微机上应用视频而推出的文件格式。同时,Apple公司也推出了为MOV视频文件格式应用而设计的QuickTime软件。这种软件有在Macintosh和PC机上使用的两个版本,因此,在多媒体PC机上也可以使用MOV视频文件格式。 QuickTime软件和MOV视频文件格式已经非常成熟,应用范围非常广泛。
常见多媒体素材的格式和特点
(一)图片
几种常见的图片存储格式及特点。
格式 特点
BMP 无压缩,不会丢失图像的任何细节,但是占用的存储空间大
JPG(JPEG) 一种常用的压缩格式,占用的存储空间小
GIF 颜色的失真度较大,有动态和静态两种
WMF 微软公司自定的矢量图格式,OFFICE剪辑库中的图形就是以这种格式保存的
常用的图形软件有:ACDSee、PhotoShop等。
(二)声音
几种常见的声音存储格式及特点。
格式 特点
WAV 无压缩,音质最好,但占用的存储空间大
MIDI 电脑音乐的统称,占用的存储空间很小
MP3 将WAV压缩后的一种音乐格式,占用空间小,声音质量高
WMA 微软公司的一种声音格式,占用空间比MP3小,且声音质量很高
常用的播放声音的软件有:Windows Media Player、Winamp、豪杰超级解霸等
(三)视频和动画
几种常见的视频和动画的存储格式及特点。
格式 特点
AVI 由视频和音频两部分组成,无压缩,高质量,但占用存储空间大
RM 质量不高,占用空间小,一般用于低速网上实时传输音频和视频信息的压缩格式
DAT VCD影碟中的视频文件
SWF Flash动画,占用的空间小
常用的视频播放软件有:豪杰超级解霸、Realone Player、Windows Media Player、Flash Player等
获取多媒体素材
一、方法
1. 从光盘获取
2. 从网络获取
3. 自己制作多媒体素材
二、从网络获取多媒体素材
1、搜索引擎的分类
获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullText Search Engine)和分类目录Directory)。
全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按以定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确;
分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”。 分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。
二、搜索引擎的工作原理
搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
二、通过搜索引擎缩小搜索范围
确定了使用哪个搜索引擎后,最好先使用含义较广的词开始搜索,然后再逐步缩小范围。熟悉逻辑运算符的用法将有助于在Internet上查找资料。记住:每个搜索引擎都是不同的,开始查找前先看一下搜索引擎的帮助页面。
1、使用逻辑运算符
如果可供选择的东西太多或者得到的是错误结果,一些搜索引擎允许你用逻辑运算符来缩小范围。逻辑运算符有3种:OR、AND及NOT。
AND 返回的结果满足每一个条件。
OR 返回的结果满足其中一个条件。
NOT 返回的结果排除条件所要求的记录。
2、使用简化的逻辑运算符
Ø 使用“需要”、“排除”等概念
一搜索引擎允许你在搜索时指定多个重要的关键词。在关键词前插入“+”,表示在返回结果时需要此条件;在关键词前插入“-”,表示在返回结果时排除此条件(比如:+中国+教育技术-电化教育,表明返回的网站内容中包含关键词“中国”与“教育技术”,但不包含“电化教育”)。
Ø 用短语查找
如果要寻找准确的短语或短句,需要把这些短语放在双引号中(如:“建构主义教学原则”)。
Ø 使用通配符
如果你想要的搜索结果包括不同的拼写或单词结尾,可输入关键词的第一个部分并插入一个符号,通常是“*”(如:education*可得到educational,educationist,educationally等)。
一、文本
文本指的是字母、数字和符号,与其他媒体相比,文字是最容易处理、占用存储空间最少、最方便利用计算机输入和存储的媒体。文本显示是多媒体教学软件的非常重要的一部分。多媒体教学软件中概念、定义、原理的阐述、问题的表述、标题、菜单、按钮、导航等都离不开文本信息。它是准确有效地传播教学信息的重要媒体元素。文字是一种常用的媒体元素。
文件格式和特点
.TXT:TXT文本是纯文本文件是无格式的,即文件里没有任何有关字体、大小、颜色、位置等格式化信息。Windows系统的“记事本”就是支持TXT文本的编辑和存储工具。所有的文字编辑软件和多媒体集成工具软件均可直接调用TXT文本格式文件。记事本的功能也很强大,
.DOC:DOC是Word字处理软件所使用的文件格式。
.WPS:WPS是中文字处理软件的格式,其中包含特有的换行和排版信息,它们被称为格式化文本,只能在特定WPS编辑软件中使用。
.RTF:带格式的纯文本文件,Windows系统的“写字板”就是支持rtf文本的编辑和存储工具。
二、图形
计算机中的图形是数字化的,是矢量图,矢量图形是通过一组指令集来描述的,这些指令描述构成一幅图的所有直线、圆、圆弧、矩形、曲线等的位置、维数和大小、形状。显示时需要专门的软件读取这些指令,并将其转变为屏幕上所显示的形状和颜色。矢量图是利用称为Draw的计算机绘图程序产生的。矢量图主要用于线形的图画、美术字、工程制图等。
文件格式和特点
.WMF Windows图元文件格式
.EMF Windows增强性图元文件格式
.CDR CorelDRAW制作生成的.CDR文件文件
三、图像
这里讲的图像指的是位图,它是由描述图像中各个像素点的强度与颜色的数位集合组成的。位图图像适合表现比较细致,层次和色彩比较丰富,包含大量细节的图像。生成位图图像的方法有多种,最常用的是利用绘图的软件工具绘制,用指定的颜色画出每个象素点来生成一幅图形。
文件格式和特点
.BMP BMP(Bitmap的缩写)图像文件是几乎所有Windows环境下的图形图像软件都支持的格式。这种图像文件将数字图像中的每一个像素对应存储,一般不使用压缩方法,因此BMP格式的图像文件都较大,特别是具有24位色深(2的24次方种颜色)的真彩色图像更是如此。由于BMP图像文件的无压缩特点,在多媒体节目制作中,通常不直接使用BMP格式的图像文件,只是在图像编辑和处理的中间过程使用它保存最真实的图像效果,编辑完成后转换成其他图像文件格式,再应用到多媒体项目制作中。
.GIF PNG(Portable Network Graphics)图像文件格式提供了类似于GIF文件的透明和交错效果。它支持使用24位色彩,也可以使用调色板的颜色索引功能。可以说PNG格式图像集中了最常用的图像文件格式(如GIF,JPEG)的优点,而且它采用的是无损压缩算法,保留了原来图像中的每一个像素。
.JPG JPEG图像文件格式采用的是较先进的压缩算法。这种算法在对数字图像进行压缩时,可以保持较好的图像保真度和较高的压缩比。这种格式的最大特点是文件非常小,用户可以根据自己的需要选择JPEG文件的压缩比,当压缩比为16:1时,获得压缩图像效果几乎与原图像难以区分;当压缩比达到48:1时,仍可以保持较好的图像效果,仔细观察图像的边缘可以看出不太明显的失真。因为JPEG图像的压缩比很高,因此非常适用于要处理大量图像的场合。JPEG图像格式是目前应用范围非常广泛的一种图像文件格式。
四、动画
动画是通过一系列彼此有差别的单个画面来产生运动画面的一种技术,通过一定速度的播放可达到画中形象连续变化的效果。要实现动画首先需要有一系列前后有微小差别的图形或图像,每一幅图片称为动画的一帧,它可以通过计算机产生和记录。只要将这些帧以一定的速度放映,就可以得到动画,称为逐帧动画。
在教学中,往往需要利用动画来模拟事物的变化过程,说明科学原理,尤其是二维动画,在教学中应用较多。在许多领域中,利用计算机动画来表现事物甚至比电影的效果更好。因此,较完善的多媒体教学软件都应配有动画以加强教学效果。
文件格式和特点
.FLC Flash源文件存放格式。在Flash中,大量的图形是矢量图形,因此,在放大与缩小的操作中没有失真,它制作的动画文件所占的体积较小。Flash5动画编辑软件功能强大,操作简单,易学易用。
.SWF Flash动画文件格式。
.GIF GIF格式是常见的二维动画格式。
.AVI 严格说来,AVI格式并不是一种动画格式,而是一种视频格式,它不但包含画面信息,亦包含声音效果。因为包含声音的同步问题,因此,这种格式多以时间为播放单位,因此在播放时,不能控制其播放速度。
五、声音
声音通常有语音、音效和音乐等三种形式。语音指人们讲话的声音;音效指声音特殊效果,如雨声、铃声、机器声、动物叫声等等,它可以是从自然界中录音的,也可以采用特殊方法人工模拟制作;音乐则是一种最常见的声音形式。
在多媒体教学软件中,语言解说与背景音乐是多媒体教学软件中重要的组成部分。最常见通常有三类声音,即波形声音、MIDI和CD音乐,而在多媒体教学软件中使用最多的是波形声音。
文件格式和特点
.WAV 波形声音文件格式,波形声音,它是通过对声音采样生成。在软件中存储着在经过模数转换后形成的千万个独立的数码组,数码数据表示了声音在不连续的时间点内的瞬时振幅。
.MID MIDI声音文件格式,MIDI(乐器数字接口)是一个电子音乐设备和计算机的通讯标准。MIDI数据不是声音,而是以数值形式存储的指令。一个MIDI文件是一系列带时间特征的指令串。实质上,它是一种音乐行为的记录,当将录制完毕的MIDI文件传送到MIDI播放设备中去时,才形成了声音。MIDI数据是依赖于设备的,MIDI音乐文件所产生的声音取决于用于放音的MIDI设备。
.MP3 MP3是以MPEG Layer 3标准压缩编码的一种音频文件格式。MPEG编码具有很高的压缩率,我们通过计算可以知道,一分钟CD音质 (44100 Hz,16 Bit,2 Stereo,60 Second)的WAV文件如果未经压缩需要10兆左右的存储空间。MPEG Layer 3的压缩率高达1:12。以往1分钟左右的CD音乐经过MLPEG Layer 3格式压缩编码后,可以压缩到1兆左右的容量,其音色和音质还可以保持基本完整而不失真。
六、视频
视频(Video)与动画一样,由连续的画面组成,只是画面是自然景物的动态图像。视频一般分为模拟视频和数字视频,电视、录像带是模拟视频信息。当图像以每秒24帧以上的速度播放时,由于人眼的视觉暂留作用,我们看到的就是连续的视频。多媒体素材中的视频指数字化的活动图像。VCD光盘存储的就是经过量化采样压缩生成的数字视频信息。视频信号采集卡是将模拟视频信号在转换过程中压缩成数字视频,并以文件形式存入计算机硬盘的设备。将视频采集卡的视音频输入端与视音频信号的输出端(如摄像机、录像机、影碟机等)连接之后,就可以采集捕捉到的视频图像和音频信息。
视频文件是由一组连续播放的数字图像(Video)和一段随连续图像同时播放的数字伴音共同组成的多媒体文件。其中的每一幅图像称为一帧(frame),随视频同时播放的数字伴音简称为“伴音”。
文件格式和特点
.AVI AVI(Audio Video Interleave)是Microsoft公司开发的一种伴音与视频交叉记录的视频文件格式。在AVI文件中,伴音与视频数据交织存储,播放时可以获得连续的信息。这种视频文件格式灵活,与硬件无关,可以在PC机和Microsoft Windows环境下使用。
.VOB DVD视频文件存储格式。
.DAT VCD视频文件存储格式。
.wmvMpeg编码视频文件。
.MPEG 同上。
.RM 实时声音(real audio)和实时视频(real video)是在计算机网络应用中发展起来的多媒体技术,它可以为使用者提供实时的声音和视频效果。Real采用的是实时流 (streaming)技术,它把文件分成许多小块像工厂里的流水线一样下载。用户在采用这种技术的网页上欣赏音乐或视频,可以一边下载一边用Real播放器收听或收看,不用等整个文件下载完才收听或收看。Real格式的多媒体文件又称为实媒体(Real Media)或流格式文件,其扩展名是.RM、.RA或.RAM。在多媒体网页的制作中,已成为一种重要的多媒体文件格式。如果要在网页中使用类似Real格式文件那样的“流式播放”技术,不仅要求浏览器的支持,还需要使用支持流式播放的网页服务器。
.MOV MOV是Apple公司为在Macintosh微机上应用视频而推出的文件格式。同时,Apple公司也推出了为MOV视频文件格式应用而设计的QuickTime软件。这种软件有在Macintosh和PC机上使用的两个版本,因此,在多媒体PC机上也可以使用MOV视频文件格式。 QuickTime软件和MOV视频文件格式已经非常成熟,应用范围非常广泛。
常见多媒体素材的格式和特点
(一)图片
几种常见的图片存储格式及特点。
格式 特点
BMP 无压缩,不会丢失图像的任何细节,但是占用的存储空间大
JPG(JPEG) 一种常用的压缩格式,占用的存储空间小
GIF 颜色的失真度较大,有动态和静态两种
WMF 微软公司自定的矢量图格式,OFFICE剪辑库中的图形就是以这种格式保存的
常用的图形软件有:ACDSee、PhotoShop等。
(二)声音
几种常见的声音存储格式及特点。
格式 特点
WAV 无压缩,音质最好,但占用的存储空间大
MIDI 电脑音乐的统称,占用的存储空间很小
MP3 将WAV压缩后的一种音乐格式,占用空间小,声音质量高
WMA 微软公司的一种声音格式,占用空间比MP3小,且声音质量很高
常用的播放声音的软件有:Windows Media Player、Winamp、豪杰超级解霸等
(三)视频和动画
几种常见的视频和动画的存储格式及特点。
格式 特点
AVI 由视频和音频两部分组成,无压缩,高质量,但占用存储空间大
RM 质量不高,占用空间小,一般用于低速网上实时传输音频和视频信息的压缩格式
DAT VCD影碟中的视频文件
SWF Flash动画,占用的空间小
常用的视频播放软件有:豪杰超级解霸、Realone Player、Windows Media Player、Flash Player等
获取多媒体素材
一、方法
1. 从光盘获取
2. 从网络获取
3. 自己制作多媒体素材
二、从网络获取多媒体素材
1、搜索引擎的分类
获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullText Search Engine)和分类目录Directory)。
全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按以定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确;
分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”。 分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。
二、搜索引擎的工作原理
搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
二、通过搜索引擎缩小搜索范围
确定了使用哪个搜索引擎后,最好先使用含义较广的词开始搜索,然后再逐步缩小范围。熟悉逻辑运算符的用法将有助于在Internet上查找资料。记住:每个搜索引擎都是不同的,开始查找前先看一下搜索引擎的帮助页面。
1、使用逻辑运算符
如果可供选择的东西太多或者得到的是错误结果,一些搜索引擎允许你用逻辑运算符来缩小范围。逻辑运算符有3种:OR、AND及NOT。
AND 返回的结果满足每一个条件。
OR 返回的结果满足其中一个条件。
NOT 返回的结果排除条件所要求的记录。
2、使用简化的逻辑运算符
Ø 使用“需要”、“排除”等概念
一搜索引擎允许你在搜索时指定多个重要的关键词。在关键词前插入“+”,表示在返回结果时需要此条件;在关键词前插入“-”,表示在返回结果时排除此条件(比如:+中国+教育技术-电化教育,表明返回的网站内容中包含关键词“中国”与“教育技术”,但不包含“电化教育”)。
Ø 用短语查找
如果要寻找准确的短语或短句,需要把这些短语放在双引号中(如:“建构主义教学原则”)。
Ø 使用通配符
如果你想要的搜索结果包括不同的拼写或单词结尾,可输入关键词的第一个部分并插入一个符号,通常是“*”(如:education*可得到educational,educationist,educationally等)。








发表评论 评论 (0 个评论)