您的当前位置:首页 > 百科 > GitHub实施更严格的风控规则阻止中文用户访问 疑似是为了反爬虫和反抓取 – 蓝点网 正文
时间:2025-08-28 13:05:43 来源:网络整理 编辑:百科
#科技资讯 GitHub 实施更严格的风控规则阻止中文用户访问,疑似是为了反爬虫和反抓取。根据网友反馈情况来看 GitHub 会先检测 IP 地址质量,如果是脏 IP 则会触发风控规则,接着检测请求头
早前 GitHub 因为失误部署了屏蔽所有中国 IP 地址的蓝点规则,中国 IP 地址访问时会出现禁止访问提示,实施随后 GitHub 更新规则并解释是更严格的规则部署错误,更新规则后中国 IP 地址可以重新访问。风控访问
如果之前是阻止中文抓失误那现在肯定就是故意的了,GitHub 部署的用户疑新规则会对用户语言进行检查,如果用户使用的为反网是中文 (仅限 zh_CN) 则可能会触发限制而被限制访问,不过从情况来看 GitHub 应该是为了反爬虫的 (例如某 SDN 无差别拉取 GitHub 上的项目搬到自家平台)。
从测试情况来看 GitHub 将多个条件整合用来触发限制,例如首先检查 GitHub 的常规规则 (包括黑名单 IP 和 UA),然后检测 IP 地址质量,以上两个条件全部通过后再检查第三个条件,也就是浏览器请求头的语言部分是否包含 zh_CN,如果检测到用户使用的中文则会返回错误。
也就是说 GitHub 并没有针对特定区域的 IP 进行封禁,如果用户 IP 质量没问题的话则不会触发语言检测,因此如果用户使用企业代理软件访问 GitHub 的话就可能因为 IP 地址质量差 (脏 IP) 而触发语言检测。
从这些情况来看 GitHub 大概率是为了反爬虫和反抓取,目前大量 AI 爬虫对 GitHub 疯狂抓取用来训练模型,这种抓取行为不仅会给 GitHub 服务器造成负担,也会浪费大量流量造成 GitHub 成本增加。
如果用户并非爬虫并且访问受到影响,那也可以进行针对性的解决:
1. 简单方法就是直接修改请求头将语言修改为 en_US 等其他未被限制的语言
2. 更换质量更好的 IP 地址避免触发风控,当然更换 IP 地址可能会增加潜在使用成本
不过针对语言的检测很容易被绕过,接下来 GitHub 很有可能会观察情况并对修改语言的行为进行检测,毕竟反爬虫是个长期工作,GitHub 也只能根据爬虫的情况进行针对性的策略调整实现封禁。
OpenAI将修复ChatGPT过于谄媚的问题 虽然部分用户认为这似乎不是问题 – 蓝点网2025-08-28 12:48
Anthropic发布Claude 4 编程和复杂任务处理能力大幅度提升 但上下文仍然是200K – 蓝点网2025-08-28 12:32
AI研究员讨论Claude 4的举报模式 当发现用户存在极其不道德做法时会自动举报 – 蓝点网2025-08-28 12:19
推出仅5年英特尔就放弃Deep Link技术套件的支持 未来不会再发布任何更新 – 蓝点网2025-08-28 11:46
安装VMware软件更新都算侵权?博通要求永久许可证用户额外付费签订支持合同 – 蓝点网2025-08-28 11:25
英特尔推出适用于200S系列处理器的官方超频工具 能提高7.5%性能且不影响保修 – 蓝点网2025-08-28 11:23
如果最终Chrome要从谷歌剥离的话 OpenAI有意收购该浏览器 – 蓝点网2025-08-28 11:06
已停止运营的聚合搜索引擎F搜被360起诉索赔500万元 开发者甚至无法承担诉讼成本 – 蓝点网2025-08-28 10:52
Perplexity AI将推出Comet浏览器 全方位追踪用户数据并提供精准广告 – 蓝点网2025-08-28 10:37
B站否认在用户访问网页版时使用CPU进行PCDN流量分发 相关说法纯属猜测 – 蓝点网2025-08-28 10:28
腾讯云SDK发布超过20万个版本导致GitHub无法正常加载 腾讯云回应称正在进行优化 – 蓝点网2025-08-28 13:02
单字母顶级域名邮箱!埃隆马斯克确认将推出@X.com邮箱服务 – 蓝点网2025-08-28 12:57
通过教育邮箱开通的Cursor AI正在被回收 疑似Cursor AI发现冒领后正在清查 – 蓝点网2025-08-28 12:37
微软商店变得更加开放 个人开发者不需要缴纳19美元即可注册 后续将显示软件更新时间 – 蓝点网2025-08-28 12:32
欧盟可维修性强制标签从6月20日起生效 手机/平板必须贴上是否容易维修和耐用性评级 – 蓝点网2025-08-28 12:31
加密通信应用Signal发布新版本阻止Windows 11 Recall(回顾)截取其用户的聊天记录 – 蓝点网2025-08-28 11:39
OpenAI将修复ChatGPT过于谄媚的问题 虽然部分用户认为这似乎不是问题 – 蓝点网2025-08-28 11:15
阿里云多个域名注册/续费价格将在5月7日上涨 如有需要请尽早注册/续费/转出 – 蓝点网2025-08-28 10:51
Linux 6.6中的SELinux删除了对其起源美国国家安全局(NSA)的引用 – 蓝点网2025-08-28 10:35
技嘉在X870主板中预留64MB芯片用来保存Wi2025-08-28 10:30