论文部分内容阅读
本文利用xml和java的httpclient技术及正则表。通过对网络中视频信息的列表抓取。列表页面分析获得视频的名称、图片地址、视频播放页地址、视频播放页连接地址、标签和视频流地址。充分挖掘网络视频资源。节省存储空间和带宽;其次。通过抓取分析视频信息的rss文件。获取其新增的内容扩大自己视频资源.定时抓取他人主页.分析视频信息获取焦点的视频内容。以减少编辑成本;最后运用lucene搜索引擎框架.把获取的信息建成索引库。为客户提供强大搜索功能。