http -如何卷曲或折叠网页?

Translate

我想做一个每晚的Cron作业,以获取我的stackoverflow页面并与前一天的页面进行比较,因此我可以看到我的问题,答案,排名等的变更摘要。

不幸的是,我无法获得正确的Cookie等来完成这项工作。有任何想法吗?

此外,测试版结束后,是否无需登录即可访问我的状态页面?

This question and all comments follow the "Attribution Required."

所有的回答

Translate

现在,您无需登录即可进入状态页(点击登出并尝试一下)。当禁用beta-cookie时,您与状态页之间将没有任何关系。

对于wget:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
来源
Translate

马克·哈里森

这是可行的...

curl -s --cookie soba =。https://stackoverflow.com/users

对于wget:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
来源
Translate

好主意 :)

我想你用过wget的

--load-cookies (filename)

可能会有所帮助,但是使用Mechanize(在Perl或python中)之类的东西来更完全地模仿浏览器以获得更好的蜘蛛可能会更容易。

来源
Translate

我也无法弄清楚如何使cookie正常工作,但是注销后我能够在浏览器中进入状态页面,因此我认为一旦stackoverflow公开就可以使用。

这是一个有趣的想法,但是您是否也不会摘录底层html代码的差异?您是否有一种策略可以避免以html的差异而不是实际内容结尾?

来源
Translate

这是可行的...

curl -s --cookie soba=. http://stackoverflow.com/users
来源