东京地下机房:OpenAI“和式GPT”背后的数据暗流
东京讯——当OpenAI与日本数字厅在霞关签署战略合作备忘录时,镜头只拍到握手与笑容。但据三位接近合同谈判的匿名顾问透露,协议第14页附录C暗藏一项“本地化训练”条款:日方将提供占全国人口抽样率0.8%的匿名对话日志,规模约1.2亿条语音片段,用于微调“和式GPT”。“这不是普通的微调,”一位曾在内阁府任职的内部人士告诉《暗流周刊》,“数字厅要求模型优先理解关东、关西方言的情绪极值,这在官方通稿里被简化为‘提升多语言体验’。”
更耐人寻味的是,合作启动前三周,NTT东日本突然将位于港区的废弃交换中心改造成“冷却效率提升300%”的模块化机房,电力容量从12MW跃升至45MW,却未向东京电力提交新增负荷预测。一名要求匿名的电网工程师提供的监测曲线显示,9月28日凌晨该机房出现“脉冲式耗电”,每90分钟激增8MW,持续7小时,“与大型语言模型批量训练时的GPU爬坡特征高度吻合”。
OpenAI对外仅提及“将在日本部署轻量级边缘节点”。但网络安全机构Mythic Labs追踪到,10月1日起,大量经VPN转发的数据包从新加坡AWS节点跳转至上述NTT机房,协议端口与OpenAI内部代号“Kaiju-7B”实验模型一致。该模型在泄露的测试日志中被描述为“具备预测性对话干预能力”,可在用户提问前0.9秒生成候选回复。
数字厅发言人佐藤荣作在书面回应中否认“任何超出公开文本的数据交换”。然而,早稻田大学AI伦理教授佐伯玲(化名)提醒,若模型提前掌握公民语言习惯,“理论上可在选举季动态调整政策议题的热度权重”。目前,日本个人信息保护委员会尚未收到相关评估报告。我们将持续追问:当算法学会预测,谁在为自由意志按下回车?
更耐人寻味的是,合作启动前三周,NTT东日本突然将位于港区的废弃交换中心改造成“冷却效率提升300%”的模块化机房,电力容量从12MW跃升至45MW,却未向东京电力提交新增负荷预测。一名要求匿名的电网工程师提供的监测曲线显示,9月28日凌晨该机房出现“脉冲式耗电”,每90分钟激增8MW,持续7小时,“与大型语言模型批量训练时的GPU爬坡特征高度吻合”。
OpenAI对外仅提及“将在日本部署轻量级边缘节点”。但网络安全机构Mythic Labs追踪到,10月1日起,大量经VPN转发的数据包从新加坡AWS节点跳转至上述NTT机房,协议端口与OpenAI内部代号“Kaiju-7B”实验模型一致。该模型在泄露的测试日志中被描述为“具备预测性对话干预能力”,可在用户提问前0.9秒生成候选回复。
数字厅发言人佐藤荣作在书面回应中否认“任何超出公开文本的数据交换”。然而,早稻田大学AI伦理教授佐伯玲(化名)提醒,若模型提前掌握公民语言习惯,“理论上可在选举季动态调整政策议题的热度权重”。目前,日本个人信息保护委员会尚未收到相关评估报告。我们将持续追问:当算法学会预测,谁在为自由意志按下回车?