最近项目需要一个爬虫。通过医院名称关键词爬去医院相关网站链接。主要包括官方网站。 源医院关键词文件: 先贴爬虫数据结果表: 这里主要介绍一下这个框架:Beautiful Soup Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,使用起来非常方便。 有正在学习Python爬虫方面的朋友如有需要源码可以联系我。 注:本文内容均系原创。如需转载分享请标明出处。 posted at 2015-03-16