设为首页收藏本站

创新应用

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 120797|回复: 458

【CX】采集器商业版 更新记录,最新版本VIP2.9F5 2014/3/5

    [复制链接]
发表于 2010-11-2 12:27 | 显示全部楼层 |阅读模式
难免有未通知更新的用户,可以在这里查看最新的vip版更新信息。
更新方式,进入 快捷导航>商业用户 处,自行下载x2.5的安装包.兼容x1,x1.5,x2,x2.5请放心下载.
请用二进制模式上传. 上传覆盖后,有版本变动的务必点升级或更新

VIP2.9F3 2012年6月5号更新
修复VIP2.9F中门户采分页的错误提示
修复VIP2.9版无法提交采集url的bug
VIP2.9F 2012年6月2号更新
修复调用禁言用户修复数据库错误
改进列表url的输入方式
添加卸装的选项
添加http代理支持
添加cookie登录支持, 建议用火狐firebug获取, 部分网站需要把采集器的UA(浏览器标识)设置成火狐的UA
VIP2.9 2012年5月23号更新
更新:不再强制要求设置附件保存位置,可以自由导入到门户或论坛. 为了节省服务器资源还是建议在导入位置里选上第一栏.
更新:x2.5版无需再设置兼容模式
更新:授权方式,在线获取授权,目前不再支持本地调试, 需要的可以把已授权的域名用host文件解析到本地再调试.
请不要尝试在未授权的站点或域名上安装或使用, 会导致授权被取消.
更新:精简代码,合并不必要的文件.
添加:规则分享库
修复已经反馈的bug

VIP2.8 2012年3月27号更新(兼容X2.5版)

修复已经bug 已经升级到3月9号版的,下载后直接覆盖就可以,不需要点升级这步. 其它版本请必务覆盖后点升级.
VIP2.8 2012年3月9号更新(兼容X2.5版)
本版为入门版,所有商业用户都可以升级,其它版本陆续发布
更新详情在个人版发布后再统一编写^_^。

VIP1.85F 11月16号更新(本版本主要修复bug,新增功能的版本近期会推出.)
修复:批量导入替换词出现找不到文件的bug
更新:开启缩略图时,文章部分改为直接调用小图.
VIP1.85F 10月27号更新
修复除站长外的其它后台管理成员使用采集器的问题,需要后台开启相关权限包括 基本权限> 开启授权插件的使用权限
修复超级格式化空白字符失效ok
修复段落样式修正去掉</p>ok
修复部分服务器论坛的图片列表不显示图片的问题ok
修复超级格式化下,选择过滤段落但不过滤的问题.ok
修复随机时间为按照发帖时间先后时有时会导致部分数据导入失败的问题ok
修复测试列表标题识别规则显示不对的问题ok
修复部分chunked编码内容下载不完整的bug ok
修复断点续传无效的问题 ok
修复有分页时导入版块中的标题不对ok
修复有手动导入时最新更新信息提示不对的情况ok
修复没删除缓存文件权限的批量采集问题.ok
修复导入到论坛内容对 html实体内容的支持.ok
进一步完善环境的测试.ok


5月24号更新:
修复x2下有时不导入帖子数据的问题.直接覆盖就行.

VIP1.85 5月23号更新
修复不设置生成缩略图 图片幻灯片无法调用采集到的图片问题(旗舰版支持自动设置封面,需要规则设置生成缩略图)
修复部分服务器下载图片附件失败时导致导入失败的问题
完善对 xxxx年xx月xx日 xx时xx分 的发布时间识别
添加支持断点续传,修复部分服务器采集附件不完整的问题.(only VIP版)
支持部分用户更改后台admin.php的文件名的情况,自行在config_robot.php里修改.

VIP1.8 9号更新:(版本没变动的直接覆盖就行.)
修复格式化中按段落样式二处理在某些特定情况下会出现乱码的问题.
修复格式化中处理空白字符效果不理想的问题.


VIP1.8更新说明(2011/5/5 15:15)
环境要求:
php v5.2或以上版本
需要Zend Optimizer v3.3.x或Zend Guard Loader(for PHP v5.3)
覆盖前请备份插件.

添加可以设置插件的使用用户,在config_robot.php文件里设置.
添加对按gzip压缩的网页的支持ok
优化对chunked编码的支持ok
添加格式化选项,过滤哪些标签, 图片统一居中,段落统一缩进,隔行.ok

添加后台参数设置,可以设置默认的发帖用户.ok
添加对后续版本同类型规则的导入支持ok
更新采内容页的refer改回引用文章列表地址 ok
更新列表自动增长的最大值为2147483647.ok
修复一次性导入,会导入已经导入没有删除的帖子 ok
修复发帖uid规则设置不当时会出现游客发帖的情况.ok

修复发帖uid规则设置为用户组时失效的问题.请重新下载附件,覆盖一下.
修复格式化在个别情况下出现部分乱码的问题.
完善环境检查文件,提示更准确.避免出现乱码或白屏的情况.如果还出现白屏请检查zend loader的版本.

修复部分图片链接分析失误ok
修复格式化时,图片url前缀失效的问题ok
修复某些情况下的图片附件没有替换标签ok
修复设置随机浏览数时会成分批的情况.ok
修复内容采用自动识别时没有自动识别内容的问题,不建议用自动识别.ok



VIP1.65更新说明(2011/3/1 3:00)
更新方式,进入 我的中心>商业用户 处,自行下载安装包.
添加:采集文章的发布时间,发布时间规则的设置位置移到底部.详情看界面说明.
添加:支持没有后缀名的图片采集
添加:后台自助下载更新包
更新:检测重复的机制,更易用,效果更好.不用担心设置不当导致重复出现了.
更新:要是检测不到要下载的文件类型,则不下载返回原始的url地址
修复:采集核心解决一个卡住的情况.
修复:部分图片链接分析失误
修复:群组帖子无法通过DIY调用的问题.
修复:群组帖子统计不对.

VIP1.6更新说明
旗舰版VIP1.6版使用环境说明
本插件适用于php 5.1以上版本.
本版本使用全新原创采集核心不再强制要求开启allow_url_fopen或CURL。当然开了也没关系.


添加:旗舰商业版添加商业版原创核心 更高效,更稳定,环境兼容性更好的核心.可以不开启allow_url_fopen,也可以不需要curl模块.
添加:curl的支持
添加:插件参数后台设置,方便大家使用,不再需要设置congif_robot.php文件.
添加:后台设置URL和标题监测,可自定义检查机制,按robotid,按host或按全部记录
添加:导入规则添加直接选择文件
添加:导入导出规则时的编码处理,统一规则的编码,避免乱码
添加:规则中对|,*的转义,要表示|字符请用\|,要表示*请用\*
添加:内容页的编码设置,分开设置编码
添加:发帖时的随机时间范围设置,发帖更逼真
添加:同义库批量删除
更新:统一同义库界面风格
更新:完善相对url转换成绝对url
更新:被采集页面的编码:GB2312 您的网站编码为:gbk 不进行转码. gbk的字符集兼容GB2312.
更新:优化采集时的提示
更新:如果下载图片失败或图片不存在,返回网址
更新:自动调整采集总数和列表地址增加非自动增长模式下的采集个数自动倍增.
更新:内容不为空时,才记录标题.

修复同义库第2页之后无法修改的问题
修复计划任务时不采集分页的问题.
修复:导入论坛的html实体转换问题
修复:分页url自动去掉跟第一页相同的url.
修复:2个函数名与dz自带函数重复问题
修复:不允许导入不同插件版本的规则时,还导入的问题.由于向下兼容本版本默认选中允许导入不同版本.

注意:由于新版本增加较多设置项,为保证导出规则的准确性,新版本导出的规则旧版本插件用不了,导入规则兼容旧版本.
注意:升级时会更新所有旧规则和插件的数据库结构以适应新版本.覆盖后,务必在管理后台的插件列表中选升级.
注意:新版本重复文章检测的设置有所改动,建议大家全新编辑一下规则设置.



VIP1.55更新说明
2010/11/14
添加:url缓存模式和更新重复标题检测算法.大大减少检测url时的数据库读写.尽量使用url的监控模式,尽量少用标题的检测.
添加:导入门户添加相关文章,在配置文件中配置添加个数或关闭.文章为同一栏目下的最新文章.
添加:在列表页采集标题(有可能有误差),填写标题识别规则看准了位置.
添加:发帖时的随机时间范围设置,在config_robot.php中设置
更新:分页的url地址检测机制和采集机制.兼容更多类型的页码导航.页码 或 上下页与页码不全的识别规则都是识别页码区,不再是下一页的url.
修复:清理检测重复的记录无效的问题
修复:含分页的回帖的随机uid问题,统一为第一帖的用户
修复:有分页时自动导入出现lastpost错误

VIP1.4更新日期:2010-11-08 17:00
首次安装的请把config_robot.new.php改为config_robot.php并配置好.
添加3个随机发帖用户模式,支持随机所有用户,指定范围的随机用户,指定发帖的用户组.具体用法看编辑规则处的说明.
添加UTF-8编码包,解决一些不必要的问题。utf-8编码的请用utf-8包
修复用户发帖数
修复下载图片失败有时会卡住的问题
修复手工导入后台临时文章,自定义时间无效的问题。
修复不采集图片到本地,门户封面还会显示的问题.
修复发布到门户.图片没采集到本地.封面显示错误的问题.若要用封面功能,必须采集图片到本地,这是DZ门户的要求.




VIP1.3
更新日期:2010-11-03 17:00
添加:升级采集核心增加字符串匹配模式,兼容更多网页.大大减少识别不了内容的问题.编写规则时请注意空格不要多了或少了.
添加:门户的浏览数设置。
更新:下载网页的函数,减少采集不了的情况
更新:导入处的"一次性导入"的默认选项为"选中项".修复查看采集结果,跳转的地址。
修复UTF8编码显示乱码。
修复采集摘要的一个bug。

VIP1.2
更新日期:2010-11-02 12:00
添加:添加采集摘要功能,如果采集到的摘要为空,自动截取内容的开始部分。也可以设置成固定值。
添加:添加自动设置文章的封面,显示前提:要求采集图片到要自己的服务器。
更新
:更新debug的测试算法,效果更准确。
修复
查看采集结果,跳转新页面的地址。

VIP1.1
更新日期:11-01 07:27
已经安装过的用户,在插件后台点升级就可以
添加:导入到论坛或群组时在内容顶部显示“来源”和“作者”。不想显示请把相关规则空着就行了。
更新:完善自动调整开始地址,适于用列表页面用自动增长模式的情况。现在可以完整支持升序和降序的情况。列表页面用自动增长模式时,建议开启URL监控。

修复:批量导入同义词的一个问题

VIP1.0
更新日期:10-29 22:47
添加:URL监控即重复URL检测。(为谢谢大家的积极反馈,故放这个功能出来)需要编辑采集器使用这个功能。
添加:清理URL和标题记录的计划任务。(为谢谢大家的积极反馈,故放这个功能出来)
更新:重复标题检测机制,不兼容原来的标题log记录。升级过程不删除原记录,懂数据库可以把旧数据表cx_robotlog自行更新到新表cx_robotitemlog
更新:安全检测机制
修复:删除未导入文章时同时删除标题记录的问题,现在删除不想要的内容后,不会再重复采集到这些内容。
修复:一些小问题































回复

使用道具 举报

发表于 2010-11-10 19:35 | 显示全部楼层
是不是购买一次就永久免费?

点评

www.xiaoxiancc.com/HTML/2442/ 御宝天师  发表于 2015-4-1 09:29
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-11-11 23:25 | 显示全部楼层
回复 elantion 的帖子

不违反使用协议的情况下,目前是的。 以购买时的协议为准。
回复 支持 反对

使用道具 举报

发表于 2011-2-3 12:00 | 显示全部楼层
回复 ec1022 的帖子

个人版 能不能:
1.采集到门户和群组
2.支持自动采集
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-2-3 13:51 | 显示全部楼层
回复 zzsns 的帖子

可以的
回复 支持 反对

使用道具 举报

发表于 2011-2-6 14:07 | 显示全部楼层
本帖最后由 zzsns 于 2011-2-6 14:25 编辑

回复 ec1022 的帖子

我用免费2.5(只能采集到论坛)测试,发现:
1.采集CMS网站的有分页的文章及其附图时,主题帖和所有的回复贴都会重复出现文章标题;
2.最后一个回复贴,会重复主题帖的内容(包括附图)
不知付费版是否也会出现这个问题?
现在2.5免费版的采集规则能否用于付费版本?
另外,很多的网络文章都被大量复制,为了避免版权纠纷,希望能增加两个功能:
1.发布到论坛的采集内容,能允许给文章标题增加“转载”
2.发布到门户的采集内容,能允许对发布者进行虚拟设置,例如:发布/作者:佚名;来源:网络,。而不必落实到具体某个用户。
个人觉得模糊设置更好些,毕竟是采集的内容,而不是原创。
回复 支持 反对

使用道具 举报

发表于 2011-2-27 06:49 | 显示全部楼层
免费版采集成功后,买了旗舰版结果采集不了了,不知道是服务器出问题了还是
回复 支持 反对

使用道具 举报

发表于 2011-2-27 06:50 | 显示全部楼层
本帖最后由 simon525 于 2011-2-27 07:19 编辑

测试了一下,规则导入后能采集。
但是问题是 自己在制作规则时点击 尝试链接无效,另外 无法指定子分类。
是不是占用资源太大?
回复 支持 反对

使用道具 举报

发表于 2011-3-1 05:39 | 显示全部楼层
頂!!! 3月1 剛來就剛更新
回复 支持 反对

使用道具 举报

发表于 2011-3-2 02:27 | 显示全部楼层
你好,我购买的旗舰版定制了“从列表页读取文章标题”的功能。请问升级后的这个安装包有这个功能么?

点评

有的  发表于 2011-3-2 14:11
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|联系我们|创新应用 ( 粤ICP备14052238号  

GMT+8, 2019-7-16 06:43

Powered by Discuz! X3.2 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表