11月15日,星期三 04:15
火讯财经讯,据IT之家11月15日报道,微软近日推出了名为“EverythingofThought”(XOT)的方法,灵感来自谷歌DeepMind的AlphaZero,利用紧凑的神经网络,来增强AI模型推理能力。微软和佐治亚理工学院、华东师范大学合作开发了该算法,整合了强化学习(reinforcementlearning)和蒙特卡洛树搜索(MCTS)能力,在复杂决策环境中,进一步提高解决问题的有效性。据悉,微软研究团队表示XOT方法可以让语言模型扩展到不熟悉的问题上,在Gameof24、8-Puzzle和PocketCube严苛测试中提升明显。结果表明,XOT明显优于其他方法,甚至解决了其他方法失败的问题。但是,XOT并没有达到100%的可靠性。