网站采集发布表单的制作
视采采集器提供模拟表单的方式发布数据,所谓模拟表单指的是软件模拟用户的行为通过用户网站的自身发布页面来发布采集到的数据。该方式可以用于文章、新闻等CMS系统的采集发布。
视采采集器的内容发布器提供模拟表单的发布功能。它需要用户定义发布表单。 视采采集器提供多种方式来制作发布表单:
- 直接定义表单
- 自动截获表单
- 手动导入表单
直接定义表单
此方式适合那些了解html技术的用户,用户通过分析发布网页的表单来定义采集器的发布表单。自动截获表单
用户通过本网站的入口,访问自身网站的发布页面并发布一篇文章,采集器将在后台自动截获刚才的提交表单。此方式非常简单适用。设置hosts文件
用记事本打开C:\Windows\System32\Drivers\Etc\hosts文件,添加如下内容:121.11.253.223 你的网站域名然后保存。关闭所有浏览器的窗口,重新打开浏览器,访问你的网站,如果出现以下信息,则表示设定成功。

设定浏览器
打开浏览器,工具->弹出窗口阻止程序->弹出窗口阻止程序设置。
在设定窗口里加入service.caijiqi.net,允许弹出网页。

定义采集规则
访问service.caijiqi.net,定义好采集单元,在设置器视图里选择内容发布器
点击自动抓包按钮,在弹出窗口里输入你的网站后台网址,选择正确的编码,点击请求按钮。

进入后台的发布页面,在表单里输入相应的值,值一般为简短的单词,如"标题","内容"等。如该输入框与某个单元对应,请在输入框里输入"$对应的单元名"。

回到抓包对话框,点击抓包按钮

等状态变为启动时,回到刚才的发布页面,提交网页,等待数秒(2-4秒),系统将自动获取当前表单。

在表单自动导入后,用户可以继续操作当前的页面,进行下一个表单的抓取,直到所有的抓包都已完成,关闭抓包对话框。 用户需要删除掉不需要的表单项,设置好正确的字符编码。如图:

然后给表单选择好对应的单元。至此一个发布表单就已制作完成。设定好其他参数后,用户可以点击设计器工具条里的'保存为模板'按钮,将当前设定保存到系统中,用户在下次设定发布规则时,可以通过'从模板中导入'按钮复用以前的设定。
手动导入表单
用户可以通过第三方抓包工具来捕获表单,然后将捕获的数据导入到我们的采集器中。 官方推荐使用HTTPAnalyzer抓包工具。软件介绍

HTTPAnalyzer是一款网络抓包软件。它实时捕捉HTTP/HTTPS协议数据,显示报文各种细节,包括:协议头信息、请求及响应的数据内容、请求的URL、请求方法、Cookie、查询字符串、表单数据、响应代码、重定向等,系统自动捕获报文数据并显示在消息列表里、用户可以详细查看报文数据、 HTTP状态消息等。用户可以过滤消息列表,显示特定的报文信息。它是个非常有用的分析、调试的开发工具。
软件安装
HTTPAnalyzer它是一款收费软件,目前已被破解。点击这里下载此软件。然后将下载的软件解压到一个目录下。如图:

keygen.exe:破解文件,通过它生成序列号。
HTTPAnalyzerStdV2.exe:抓包工具。
捕获报文
打开网页
打开IE,输入目标网站,进入信息发布页面。如图:
启动工具
点击HTTPAnalyzerStdV2.exe,启动工具。如图:
点击界面上的启动按钮的下拉菜单,点击Select a Running Process...如图:

在弹出列表里,选择iexplore.exe,点OK。如图:

捕获请求
在输入框里输入数据中文名,点击提交按钮,提交数据。如图:
回到HTTPAnalyzer窗口,查看抓包数据。如图:

列表中列出当前所有的请求。表单提交一般都是POST请求,我们将请求方式选成POST。过滤掉其他请求。如图:

点击列表中的一项,将窗口下部的视图切换成Stream视图。如图:

Stream视图的左边框里为页面请求的信息,右边框里为页面的响应信息。如图:

在左边框里点击鼠标右键,设定发布页面的编码。如图:

复制左边框里的全部数据。保存到记事本里或剪贴板中。。如图:

此时发布页面的请求报文已经捕获成功。接下来是将报文导入到视采采集器中生成表单。
生成表单
进入系统
在浏览器中进入视采采集器,定义好网页采集规则。选择内容发布器或论坛发布器,开始定义发布规则。如图:
在设计器工具条里,点击'从抓包中导入'按钮,在下拉菜单里点击需要生成的表单。如图:

将抓包数据粘贴到弹出输入框里,点击导入按钮。如图:

系统自动生成表单,用户需要删除掉不需要的表单项,设置好正确的字符编码。如图:

然后给表单选择好对应的单元。至此一个发布表单就已制作完成。设定好其他参数后,用户可以点击设计器工具条里的'保存为模板'按钮,将当前设定保存到系统中,用户在下次设定发布规则时,可以通过'从模板中导入'按钮复用以前的设定。

