请教, 大数据行业兄弟们,类似这样的数据一般是如何收集来的

查看 75|回复 10
作者:Hermitist   
只想知道如何最低成本合法的拿到类似的公开数据, 比如各国企业信息, 海关信息等.
avocadata.com/
我其实是想问如何用比较低的成本拿到 raw 数据, 然后自己处理.
        
   
   
   
   
        
            
               
   
   

大数据, 公开数据, 企业信息

tiezlk443   
我其实是想问如何用比较低的成本拿到 raw 数据, 然后自己处理.
rayyume   
凉了
oness   
wind bloomberg
JoeJoeJoe   
低成本是不可能的,早期网站没有风控时采集的。天眼查、企查查都是很早的时候( 2015 前)积累的数据。
tunggt   
慎重爬取 gov 数据
rossroma   
在国内的话,机关单位和央国企的数据,别乱采集。
即使是公开的,你采集了,随时可以抓你。
CaptainD   
这类企业一般都有国资背景,纯私企没后台是干不了的
Hermitist
OP
  
一般有何政府合作的机构售卖
以专利数据为例,专利法规定专利数据必须公开,USPTO 、EPO 等主要国家地区的知产数据都有公开可下载的链接,中国知识产权局也会每周打包放在网站供下载,也有知识产权出版社售卖这些数据
但是中国知识产权局网站很不稳定,无论爬虫还是下载都会经常失败,我怀疑他们是故意的,明面遵守专利法公开数据,私下找机构获利
CaptainD   
@JoeJoeJoe @tunggt 国内的狗都不碰, 也不值钱.
@CaptainD 你的回复很珍贵, 我主要就是想拿到国外的数据,请问有更具体的路径吗? 方便加你联系方式请教吗?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部