采集规则主表(phome_enewsinfoclass)

字段名 字段类型 解释 附加说明 兼容版本
classid int(11) 节点ID 6.6 7.0 7.2 7.5
bclassid int(11) 父节点ID 6.6 7.0 7.2 7.5
classname varchar(100) 节点名称 6.6 7.0 7.2 7.5
infourl mediumtext 采集页面地址 多个地址用回车隔开 6.6 7.0 7.2 7.5
newsclassid smallint(6) 入库栏目ID 6.6 7.0 7.2 7.5
startday date 开始时间 6.6 7.0 7.2 7.5
endday date 结束时间 6.6 7.0 7.2 7.5
bz text 备注 6.6 7.0 7.2 7.5
num smallint(6) 采集记录数 6.6 7.0 7.2 7.5
copyimg tinyint(1) 远程保存图片到本地 1为开启,0为关闭 6.6 7.0 7.2 7.5
renum smallint(6) 每组信息采集个数 6.6 7.0 7.2 7.5
keyboard text 包含采集关键字限制 6.6 7.0 7.2 7.5
oldword text 内容替换原字符 6.6 7.0 7.2 7.5
newword text 内容替换新字符 6.6 7.0 7.2 7.5
titlelen smallint(6) 不采集标题相似超过字数 6.6 7.0 7.2 7.5
retitlewriter tinyint(1) 不采集标题相同的信息 1为限制,0为不限制 6.6 7.0 7.2 7.5
smalltextlen smallint(6) 截取内容简介字数 6.6 7.0 7.2 7.5
zz_smallurl text 信息链接区域正则 6.6 7.0 7.2 7.5
zz_newsurl text 信息页链接正则 6.6 7.0 7.2 7.5
httpurl varchar(255) 内容页地址前缀 6.6 7.0 7.2 7.5
repad text 过滤广告正则 6.6 7.0 7.2 7.5
imgurl varchar(255) 图片/FLASH地址前缀 6.6 7.0 7.2 7.5
relistnum smallint(6) 每组列表采集个数 6.6 7.0 7.2 7.5
zz_titlepicl text 列表页标题图片正则 6.6 7.0 7.2 7.5
z_titlepicl varchar(255) 列表页标题图片预定义值 6.6 7.0 7.2 7.5
qz_titlepicl varchar(255) 列表页标题图片地址前缀 6.6 7.0 7.2 7.5
save_titlepicl varchar(10) 列表页标题图片远程保存 6.6 7.0 7.2 7.5
keynum tinyint(4) 关键字截取标题字数 6.6 7.0 7.2 7.5
insertnum smallint(6) 每组入库数 6.6 7.0 7.2 7.5
copyflash tinyint(1) 远程保存FLASH到本地 1为开启,0为关闭 6.6 7.0 7.2 7.5
tid smallint(6) 数据表ID 6.6 7.0 7.2 7.5
tbname varchar(60) 数据表名 6.6 7.0 7.2 7.5
pagetype tinyint(1) 分页形式 0为上下页导航式,1为全部列出式 6.6 7.0 7.2 7.5
smallpagezz text 分页区域正则(上下页式) 6.6 7.0 7.2 7.5
pagezz text 分页链接正则(上下页式) 6.6 7.0 7.2 7.5
smallpageallzz text 分页区域正则(全部列出) 6.6 7.0 7.2 7.5
pageallzz text 分页链接正则(全部列出) 6.6 7.0 7.2 7.5
mark tinyint(1) 图片加水印 1为开启,0为关闭 6.6 7.0 7.2 7.5
enpagecode tinyint(1) 页面编码转换 0为不转码 6.6 7.0 7.2 7.5
recjtheurl tinyint(1) 是否重复采集同一链接 1为重复采集,0为不重复采集 6.6 7.0 7.2 7.5
hiddenload tinyint(1) 是否隐藏已导入的信息 0为不显示,1为显示 6.6 7.0 7.2 7.5
justloadin tinyint(1) 采集后是否自动入库 1为开启,0为关闭 6.6 7.0 7.2 7.5
justloadcheck tinyint(1) 自动入库是否直接审核 1为审核通过,0为需审核 6.6 7.0 7.2 7.5
delloadinfo tinyint(1) 入库后是否删除已导入的记录 1为开启,0为关闭 6.6 7.0 7.2 7.5
pagerepad mediumtext 整体页面过滤正则 6.6 7.0 7.2 7.5
newsztid text 入库专题ID 多个专题ID用“|”隔开,例如:|1|5| 6.6 7.0 7.2 7.5
getfirstpic tinyint(4) 提取第几张图片为标题图片 6.6 7.0 7.2 7.5
oldpagerep text 整体页面替换原字符 6.6 7.0 7.2 7.5
newpagerep text 整体页面替换新字符 6.6 7.0 7.2 7.5
keeptime smallint(6) 每组采集时间间隔 6.6 7.0 7.2 7.5
lasttime int(11) 最后采集时间 unix时间戳 6.6 7.0 7.2 7.5
newstextisnull tinyint(1) 内容为空不采集 1为开启,0为关闭 6.6 7.0 7.2 7.5
getfirstspic tinyint(1) 提取标题图片生成缩略图 1为开启,0为关闭 6.6 7.0 7.2 7.5
getfirstspicw smallint(6) 提取标题图片生成缩略图宽度 6.6 7.0 7.2 7.5
getfirstspich smallint(6) 提取标题图片生成缩略图高度 6.6 7.0 7.2 7.5
doaddtextpage tinyint(1) 入库是否保留原分页 0为保留分页,1为不保留分页 6.6 7.0 7.2 7.5
infourlispage tinyint(1) 采集页面为直接内容页 1为是,0为否 6.6 7.0 7.2 7.5
repf varchar(255) 7.5
repadf varchar(255) 7.5
loadkeeptime smallint(6) 7.5
isnullf varchar(255) 7.5