自己搭建IntelliJ IDEA授权服务器

感谢 下载服务器文件 本地授权 远程服务器授权 关于内存消耗 启动和停止脚本 启动脚本 停止脚本 测试使用 启动 停止 我的授权服务器地址感谢首先说明,服务器文件不是我写的,我也是从lanyu大神那里搬过来的。我这里只是详细介绍一下如何使用。 lanyu大神博客:http://blog.lanyus.com/archives/174.html下载服务器文件下载地址:https://github.

查看更多

java爬虫系列(五)——今日头条文章爬虫实战

项目源码 https://github.com/a252937166/toutiaocrawler.git 爬虫目标 爬取某一头条号下面所有文章。 爬虫设计思路 爬取方式 动态解析网页方式爬取 之前介绍过使用webdriver的方式爬取网页内容,这样做的话好处非常明显,只需要考虑如何解析网页的element标签就行了,当然弊端也非常明显,就是效率不高。 解析接口方式爬取 没遇到反爬手段逆天的

查看更多

自己搭建VPN服务器

购买VPSVPS就是海外服务器,我们可以通过访问VPS,间接访问被墙的网站。国内服务器不行,因为你被墙的资源它同样是被墙的。安装VPNshadowsocks目前是github上最火的开源vpn了,安装和使用都非常简单,这也是我选择它最主要的原因,我这里主要介绍Centos系统安装方法。Debian / Ubuntu:apt-get install python-pip pip install sh

查看更多

java爬虫系列(一)——爬虫入门

爬虫框架介绍 Heritrix 优势 劣势 简单demo地址 crawler4j 优势 劣势 简单demo地址 WebMagic 优势 劣势 简单demo地址 快速入门 seimicrawler 项目地址 简单爬虫实现 导入项目 编写爬虫 启动爬虫爬虫框架介绍java爬虫框架非常多,比如较早的有Heritrix,轻量级的crawler4j,还有现在最火的WebMagic。 他们各有各的优势和劣势

查看更多