产品搜索
高级搜索 热门关键词 企业网站 综合网店 网上花店 医院网站 手机网店
   
 
网站公告  (14)
在线帮助  (15)
服务指南  (303)
建站指南  (141)
网站建设方案  (2)
 
企业建站 
智能网店 
专业建站 
特惠套餐 
网站精品案例展示 卓越的品质 优惠的价格 全面的服务
网站热线咨询电话:010-81588248 010-81580027 15910799489
采集过滤法则
网站建设|北京网站建设|网站制作|网站设计-北京惠通卓越公司   2010-03-07 19:07:46 作者:SystemMaster 来源: 文字大小:[][][]

dedecms采集系统确实很不错,可以免去一些站长手工添加信息的麻烦,设置一下采集规则、采集点,然后点采集,OK,几百篇文章就搞定了!呵呵,确实很省事的!下面介绍几种常用的采集规则的过滤方法:

  • 应用示例一:标题中空格的过滤

经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤

{dede:trim} {/dede:trim}

  • 应用示例二:来源作者中连接的过滤

在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

  • 应用示例三:文章内容中连接以及其他广告代码的过滤

这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

  • 应用示例四:过滤GG广告代码

其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}


下面是在综合论坛上网友的各种正则的一个全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}

好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!

推荐文章 最新文章
网站案例展示
网站申请试用方法
网站制作流程
Google 百度 搜索引擎习惯的分析
如何让你的网站讨好搜索引擎
25种方式给网站添加优质内容
灵活运用dreamweaver的13项技巧
惠通卓越网推广联盟优势
采集过滤法则
dedecms负载性能优化实例
工信部备案网站打开慢或者打不开的解决办法
ecshop修改方法
SHOP修改心得
生成的网站导出到其它服务器具体做法
状态栏中先单个字出现然后再整句
字符在状态栏中左右弹动

最新评论
发表评论  
评论标题
评论内容
图片上传
表情图标
验 证 码
关于我们 建站流程 付款方式 会员社区 联系方式 友情链接 站内搜索 常用文档 服务项目

 网站建设|北京网站建设|网站制作|网站设计-北京惠通卓越科技发展有限公司   电话:010-81588248 传真:010-81580027 手机:15910799489

  邮箱:infolyg#16nc.net 公司地址:北京市通州区乔庄东区2号院5-443

 版权所有:北京惠通卓越科技发展有限公司 国家信息产业部备案号:京ICP备09104858号

Copyright © 2005-2008 www.16nc.net All Rights Reserved

专业提供企业自助建站--网上商店系统--网上书店系统--网上花店系统