用Python编写一个国际象棋AI程序-Python教學-PHP中文網

AI 部分总述

生成棋步树

遍历树

选择最佳棋步

首頁

後端開發

Python教學

用Python编写一个国际象棋AI程序

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 10, 2016 pm 03:18 PM

ai 西洋棋

最近我用Python做了一个国际象棋程序并把代码发布在Github上了。这个代码不到1000行，大概20%用来实现AI。在这篇文章中我会介绍这个AI如何工作，每一个部分做什么，它为什么能那样工作起来。你可以直接通读本文，或者去下载代码，边读边看代码。虽然去看看其他文件中有什么AI依赖的类也可能有帮助，但是AI部分全都在AI.py文件中。

AI 部分总述

AI在做出决策前经过三个不同的步骤。首先，他找到所有规则允许的棋步（通常在开局时会有20-30种，随后会降低到几种）。其次，它生成一个棋步树用来随后决定最佳决策。虽然树的大小随深度指数增长，但是树的深度可以是任意的。假设每次决策有平均20个可选的棋步，那深度为1对应20棋步，深度为2对应400棋步，深度为3对应8000棋步。最后，它遍历这个树，采取x步后结果最佳的那个棋步，x是我们选择的树的深度。后面的文章为了简单起见，我会假设树深为2。

生成棋步树

棋步树是这个AI的核心。构成这个树的类是MoveNode.py文件中的MoveNode。他的初始化方法如下：

def __init__(self, move, children, parent) :
  self.move = move
  self.children = children
  self.parent = parent
  pointAdvantage = None
  depth = 1

登入後複製

这个类有五个属性。首先是move，即它包含的棋步，它是个Move类，在这不是很重要，只需要知道它是一个告诉一个起子往哪走的棋步，可以吃什么子，等等。然后是children，它也是个MoveNode类。第三个属性是parent，所以通过它可以知道上一层有哪些MoveNode。pointAdvantage属性是AI用来决定这一棋步是好是坏用的。depth属性指明这一结点在第几层，也就是说该节点上面有多少节点。生成棋步树的代码如下：

def generateMoveTree(self) :
  moveTree = []
  for move in self.board.getAllMovesLegal(self.side) :
    moveTree.append(MoveNode(move, [], None))
 
  for node in moveTree :
    self.board.makeMove(node.move)
    self.populateNodeChildren(node)
    self.board.undoLastMove()
  return moveTree

登入後複製

变量moveTree一开始是个空list，随后它装入MoveNode类的实例。第一个循环后，它只是一个拥有没有父结点、子结点的MoveNode的数组，也就是一些根节点。第二个循环遍历moveTree，用populateNodeChildren函数给每个节点添加子节点：

def populateNodeChildren(self, node) :
  node.pointAdvantage = self.board.getPointAdvantageOfSide(self.side)
  node.depth = node.getDepth()
  if node.depth == self.depth :
    return
 
  side = self.board.currentSide
 
  legalMoves = self.board.getAllMovesLegal(side)
  if not legalMoves :
    if self.board.isCheckmate() :
      node.move.checkmate = True
      return
    elif self.board.isStalemate() :
      node.move.stalemate = True
      node.pointAdvantage = 0
      return
 
  for move in legalMoves :
    node.children.append(MoveNode(move, [], node))
    self.board.makeMove(move)
    self.populateNodeChildren(node.children[-1])
    self.board.undoLastMove()

登入後複製

这个函数是递归的，并且它有点难用图像表达出来。一开始给它传递了个MoveNode对象。这个MoveNode对象会有为1的深度，因为它没有父节点。我们还是假设这个AI被设定为深度为2。因此率先传给这个函数的结点会跳过第一个if语句。

然后，决定出所有规则允许的棋步。不过这在这篇文章讨论的范围之外，如果你想看的话代码都在Github上。下一个if语句检查是否有符合规则的棋步。如果一个都没有，要么被将死了，要么和棋了。如果是被将死了，由于没有其他可以走的棋步，把node.move.checkmate属性设为True并return。和棋也是相似的，不过由于哪一方都没有优势，我们把node.pointAdvantage设为0。

如果不是将死或者和棋，那么legalMoves变量中的所有棋步都被加入当前结点的子节点中作为MoveNode，然后函数被调用来给这些子节点添加他们自己的MoveNode。

当结点的深度等于self.depth（这个例子中是2）时，什么也不做，当前节点的子节点保留为空数组。

遍历树

假设/我们有了一个MoveNode的树，我们需要遍历他，找到最佳棋步。这个逻辑有些微妙，需要花一点时间想明白它(在明白这是个很好的算法之前，我应该更多地去用Google)。所以我会尽可能充分解释它。比方说这是我们的棋步树：

如果这个AI很笨，只有深度1，他会选择拿“象”吃“车”，导致它得到5分并且总优势为+7。然后下一步“兵”会吃掉它的“后”，现在优势从+7变为-2，因为它没有提前想到下一步。

在假设它的深度为2。将会看到它用“后”吃“马”导致分数-4，移动“后”导致分数+1，“象”吃“车”导致分数-2。因此，他选择移动后。这是设计AI时的通用技巧，你可以在这找到更多资料（极小化极大算法）。

所以我们轮到AI时让它选择最佳棋步，并且假设AI的对手会选择对AI来说最不利的棋步。下面展示这一点是如何实现的：

def getOptimalPointAdvantageForNode(self, node) :
  if node.children:
    for child in node.children :
      child.pointAdvantage = self.getOptimalPointAdvantageForNode(child)
 
    #If the depth is divisible by 2, it's a move for the AI's side, so return max
    if node.children[0].depth % 2 == 1 :
      return(max(node.children).pointAdvantage)
    else :
      return(min(node.children).pointAdvantage)
  else :
    return node.pointAdvantage

登入後複製

这也是个递归函数，所以一眼很难看出它在干什么。有两种情况：当前结点有子节点或者没有子节点。假设棋步树正好是前面图中的样子（实际中每个树枝上会有更多结点）。

第一种情况中，当前节点有子节点。拿第一步举例，Q吃掉N。它子节点的深度为2，所以2除2取余不是1。这意味着子节点包含对手的一步棋，所以返回最小步数（假设对手会走出对AI最不利的棋步）。

该节点的子节点不会有他们自己的节点，因为我们假设深度为2。因此，他们但会他们真实的分值（-4和+5）。他们中最小的是-4，所以第一步，Q吃N，被给为分值-4。

其他两步也重复这个步骤，移动“后”的分数给为+1，“象”吃“车”的分数给为-2。

选择最佳棋步

最难的部分已经完成了，现在这个AI要做的事就是从最高分值的棋步中做选择。

def bestMovesWithMoveTree(self, moveTree) :
  bestMoveNodes = []
  for moveNode in moveTree :
    moveNode.pointAdvantage = self.getOptimalPointAdvantageForNode(moveNode)
    if not bestMoveNodes :
      bestMoveNodes.append(moveNode)
    elif moveNode > bestMoveNodes[0] :
      bestMoveNodes = []
      bestMoveNodes.append(moveNode)
    elif moveNode == bestMoveNodes[0] :
      bestMoveNodes.append(moveNode)
 
  return [node.move for node in bestMoveNodes]

登入後複製

此时有三种情况。如果变量bestMoveNodes为空，那么moveNode的值是多少，都添加到这个list中。如果moveNode的值高于bestMoveNodes的第一个元素，清空这个list然后添加该moveNode。如果moveNode的值是一样的，那么添加到list中。

最后一步是从最佳棋步中随机选择一个(AI能被预测是很糟糕的)

bestMoves = self.bestMovesWithMoveTree(moveTree)
randomBestMove = random.choice(bestMoves)

登入後複製

这就是所有的内容。AI生成一个树，用子节点填充到任意深度，遍历这个树找到每个棋步的分值，然后随机选择最好的。这有各种可以优化的地方，剪枝，剃刀，静止搜索等等，但是希望这篇文章很好地解释了基础的暴力算法的象棋AI是如何工作的。

本文由伯乐在线 - 许世豪翻译自 mbuffett。

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1665

CakePHP 教程

1423

Laravel 教程

1321

PHP教程

1269

C# 教程

1249

Related knowledge

C 中的chrono庫如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔，讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分，它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說，chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性，還提供了更高的精度和靈活性。讓我們從基礎開始，chrono庫主要包括以下幾個關鍵組件：std::chrono::system_clock：表示系統時鐘，用於獲取當前時間。 std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接內存訪問技術，允許硬件設備直接與內存進行數據傳輸，不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序，實現方式因係統而異。 2)直接訪問內存可能帶來安全風險，需確保代碼的正確性和安全性。 3)DMA可提高性能，但使用不當可能導致系統性能下降。通過實踐和學習，可以掌握DMA的使用技巧，在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C 中處理高DPI顯示？ Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現：1)理解DPI和縮放，使用操作系統API獲取DPI信息並調整圖形輸出；2)處理跨平台兼容性，使用如SDL或Qt的跨平台圖形庫；3)進行性能優化，通過緩存、硬件加速和動態調整細節級別來提升性能；4)解決常見問題，如模糊文本和界面元素過小，通過正確應用DPI縮放來解決。

C 中的實時操作系統編程是什麼？ Apr 28, 2025 pm 10:15 PM

C 在實時操作系統（RTOS）編程中表現出色，提供了高效的執行效率和精確的時間管理。 1）C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2）利用面向對象特性，C 可以設計靈活的任務調度系統。 3）C 支持高效的中斷處理，但需避免動態內存分配和異常處理以保證實時性。 4）模板編程和內聯函數有助於性能優化。 5）實際應用中，C 可用於實現高效的日誌系統。

怎樣在C 中測量線程性能？ Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析，步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析，步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能，並優化代碼。

給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時，需指定位置以優化查詢性能和數據結構；刪除字段前需確認操作不可逆；使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括：1. Binance（幣安）：提供Binance Futures量化模塊，低手續費，支持AI輔助交易。 2. OKX（歐易）：支持多賬戶管理和智能訂單路由，提供機構級風控。獨立量化策略平台有：3. 3Commas：拖拽式策略生成器，適用於多平台對沖套利。 4. Quadency：專業級算法策略庫，支持自定義風險閾值。 5. Pionex：內置16 預設策略，低交易手續費。垂直領域工具包括：6. Cryptohopper：雲端量化平台，支持150 技術指標。 7. Bitsgap：

C 中的字符串流如何使用？ Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下：1.創建輸出字符串流並轉換數據，如將整數轉換為字符串。 2.應用於復雜數據結構的序列化，如將vector轉換為字符串。 3.注意性能問題，避免在處理大量數據時頻繁使用字符串流，可考慮使用std::string的append方法。 4.注意內存管理，避免頻繁創建和銷毀字符串流對象，可以重用或使用std::stringstream。

See all articles

用Python编写一个国际象棋AI程序

AI 部分总述

生成棋步树

遍历树

选择最佳棋步

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題