您的当前位置:首页 > 百科 > GitHub实施更严格的风控规则阻止中文用户访问 疑似是为了反爬虫和反抓取 – 蓝点网 正文
时间:2025-08-28 17:04:30 来源:网络整理 编辑:百科
#科技资讯 GitHub 实施更严格的风控规则阻止中文用户访问,疑似是为了反爬虫和反抓取。根据网友反馈情况来看 GitHub 会先检测 IP 地址质量,如果是脏 IP 则会触发风控规则,接着检测请求头
早前 GitHub 因为失误部署了屏蔽所有中国 IP 地址的蓝点规则,中国 IP 地址访问时会出现禁止访问提示,实施随后 GitHub 更新规则并解释是更严格的规则部署错误,更新规则后中国 IP 地址可以重新访问。风控访问
如果之前是阻止中文抓失误那现在肯定就是故意的了,GitHub 部署的用户疑新规则会对用户语言进行检查,如果用户使用的为反网是中文 (仅限 zh_CN) 则可能会触发限制而被限制访问,不过从情况来看 GitHub 应该是为了反爬虫的 (例如某 SDN 无差别拉取 GitHub 上的项目搬到自家平台)。
从测试情况来看 GitHub 将多个条件整合用来触发限制,例如首先检查 GitHub 的常规规则 (包括黑名单 IP 和 UA),然后检测 IP 地址质量,以上两个条件全部通过后再检查第三个条件,也就是浏览器请求头的语言部分是否包含 zh_CN,如果检测到用户使用的中文则会返回错误。
也就是说 GitHub 并没有针对特定区域的 IP 进行封禁,如果用户 IP 质量没问题的话则不会触发语言检测,因此如果用户使用企业代理软件访问 GitHub 的话就可能因为 IP 地址质量差 (脏 IP) 而触发语言检测。
从这些情况来看 GitHub 大概率是为了反爬虫和反抓取,目前大量 AI 爬虫对 GitHub 疯狂抓取用来训练模型,这种抓取行为不仅会给 GitHub 服务器造成负担,也会浪费大量流量造成 GitHub 成本增加。
如果用户并非爬虫并且访问受到影响,那也可以进行针对性的解决:
1. 简单方法就是直接修改请求头将语言修改为 en_US 等其他未被限制的语言
2. 更换质量更好的 IP 地址避免触发风控,当然更换 IP 地址可能会增加潜在使用成本
不过针对语言的检测很容易被绕过,接下来 GitHub 很有可能会观察情况并对修改语言的行为进行检测,毕竟反爬虫是个长期工作,GitHub 也只能根据爬虫的情况进行针对性的策略调整实现封禁。
互联网论坛4Chan被攻击后透露攻击细节 同时声称缺乏资金进行必要维护 – 蓝点网2025-08-28 16:54
苹果更新清单将iPhone 7 Plus和两款iPhone 8列为过时产品不再提供完整维修服务 – 蓝点网2025-08-28 16:35
[附优惠码] 单字母CV域名剩余5个可半价注册 更多CV超短字符域名正在促销中 – 蓝点网2025-08-28 16:11
互联网论坛4Chan被攻击后透露攻击细节 同时声称缺乏资金进行必要维护 – 蓝点网2025-08-28 15:56
英特尔宣布裁员并精简管理层 陈立武表示官僚主义正在扼杀英特尔创新和敏捷性 – 蓝点网2025-08-28 15:39
安装VMware软件更新都算侵权?博通要求永久许可证用户额外付费签订支持合同 – 蓝点网2025-08-28 15:12
在iOS 18.5中苹果将拆机电池的诊断提示从「已使用」改成「二手」增强提醒 – 蓝点网2025-08-28 15:07
群晖证实限制NAS使用第三方非认证硬盘 原因是认证硬盘稳定性和兼容性更好 – 蓝点网2025-08-28 15:05
谷歌也在逐渐废弃远程办公 要求员工必须返回办公室否则拿着补偿金走人 – 蓝点网2025-08-28 14:56
小米被曝员工日均工时不低于11.5小时 有些团队甚至要求日均工时15小时 – 蓝点网2025-08-28 14:28
技嘉在X870主板中预留64MB芯片用来保存Wi2025-08-28 17:01
逼近110,000美元/个:比特币价格再创历史新高 – 蓝点网2025-08-28 16:53
打不过只能认输:维基百科向AI公司推出免费数据集 只求不要再无止境抓取 – 蓝点网2025-08-28 16:39
谷歌推出每月高达249.99美元的Google AI Ultra订阅 支持谷歌各种AI服务以及30TB存储空间 – 蓝点网2025-08-28 15:48
微软商店变得更加开放 个人开发者不需要缴纳19美元即可注册 后续将显示软件更新时间 – 蓝点网2025-08-28 15:24
消息称埃隆马斯克的xAI控股公司正在融资200亿美元 对X估值达到450亿美元 – 蓝点网2025-08-28 15:21
群联推出旗舰级主控芯片E28 顺序读写速度分别为14.8GB/秒和14GB/秒 – 蓝点网2025-08-28 15:05
OpenAI将修复ChatGPT过于谄媚的问题 虽然部分用户认为这似乎不是问题 – 蓝点网2025-08-28 14:50
技嘉承认RTX50系显卡存在导热凝胶渗漏并解释原因 但未提供召回或修复方案 – 蓝点网2025-08-28 14:29
安全研究人员发现某个包含1.84亿条账户密码的数据库 再次提醒用户更改泄露密码 – 蓝点网2025-08-28 14:28