python实现A*算法解决N数码问题

实现原理

整个程序实现的原理是基于A算法（A-star algorithm）来寻找一个网格（或图）上从初始状态到目标状态的最短路径。

程序实现的原理可以分为以下几个步骤，下述步骤根据下面的代码进行阐述：

定义问题空间和状态：
- 程序首先定义了问题空间，即一个N*N的网格或图。
- 每个网格位置可以有一个状态或编号，表示不同的属性或状态。
- 初始状态和目标状态分别由BLOCK和GOAL表示。
初始化搜索算法：
- 程序设置了一个OPEN列表，用于存储待扩展的节点（即待访问的网格位置）。
- 初始节点（即BLOCK表示的初始状态）被添加到OPEN列表中。
- 可能还设置了一个BLOCK列表或集合，用于记录已经访问过的节点，以避免重复访问。
A*搜索过程：
- 在每次迭代中，程序从OPEN列表中选择一个代价最小的节点进行扩展。
- 扩展节点意味着生成该节点的所有可能后继节点，并计算它们的预估代价（通常使用启发式函数，如曼哈顿距离）。
- 后继节点被添加到OPEN列表中，并根据它们的总代价（已知代价+预估代价）进行排序。
- 如果后继节点中包含了目标节点（即GOAL状态），则搜索结束，返回找到的最短路径。
路径重构：
- 当找到目标节点后，程序通过回溯父节点来重构从初始节点到目标节点的最短路径。
- 这通常是通过在搜索过程中维护每个节点的父节点引用来实现的。
性能优化和资源管理：
- 为了提高搜索效率，程序可能使用了一些优化技术，如剪枝（避免访问明显不可能到达目标状态的节点）或限制搜索深度。
- 同时，程序也需要注意资源管理，如及时关闭打开的文件、避免内存泄漏等。

实现步骤

变量定义
定义状态节点
定义曼哈顿距离计算函数
生成子节点函数
定义输出路径函数
定义A*算法
读取数据作为原始状态
查看结果

流程梳理

flowchart TD
    A([开始]) --> B[读取文件]
    B --> C{文件是否存在?}
    C -->|否| D[打印错误信息]
    D --> E[退出程序]
    E --> Z([结束])
    C -->|是| F[解析文件内容]
    F --> G[解析第一行得到 NUMBER]
    G --> H[解析第二行得到初始状态 BLOCK]
    H --> I[生成目标状态 GOAL]
    I --> J[调用 A_start 函数]
    J --> K[A星算法搜索]
    K --> L[初始化 OPEN 列表]
    L --> M[初始化 BLOCK 列表]
    M --> N{OPEN 列表为空或找到目标?}
    N -->|否| O[选择代价最小的节点]
    O --> P[扩展节点生成后继]
    P --> Q[计算预估代价和总代价]
    Q --> R[添加到 OPEN 列表并排序]
    R --> S{包含目标状态?}
    S -->|否| N
    S -->|是| T[重构最短路径]
    N -->|是| T
    T --> U[输出结果]
    U --> V[打印路径长度]
    V --> W[打印运行时间]
    W --> X[打印访问节点数]
    X --> Y[资源管理]
    Y --> AA[关闭文件]
    AA --> AB[释放资源]
    AB --> Z

注意

相关数据节点可以点击此处去下载。

代码实现

# 导入heapq模块，用于实现优先队列（最小堆）  
import heapq  
# 导入copy模块，用于对象的深拷贝  
import copy  
# 导入re模块，用于正则表达式操作  
import re  
# 导入datetime模块，用于日期和时间操作
import datetime

# 初始化一个空列表，用于存储BLOCK数据  
BLOCK = []  
# 初始化一个空列表，用于存储GOAL数据 
GOAL = []  
# 定义四个方向的移动向量：[上, 右, 下, 左]  
direction = [[0, 1], [0, -1], [1, 0], [-1, 0]]  
# 初始化一个空列表，用于存储OPEN列表（即待搜索的节点列表）  
OPEN = []  
# 初始化一个变量，用于记录已访问的节点数量  
SUM_NODE_NUM = 0

# 定义状态节点类  
class State(object):  
    # 初始化方法  
    def __init__(self, gn=0, hn=0, state=None, hash_value=None, par=None):  
        # 初始化gn（从起点到当前状态的代价）  
        self.gn = gn  
        # 初始化hn（从当前状态到目标的启发式代价）  
        self.hn = hn  
        # 计算fn（总代价，gn和hn的和）  
        self.fn = self.gn + self.hn  
        # 初始化子节点列表  
        self.child = []  
        # 初始化父节点  
        self.par = par  
        # 初始化状态（可能是二维数组或类似结构）  
        self.state = state  
        # 初始化状态的哈希值（用于快速比较状态是否相同）  
        self.hash_value = hash_value
        
    # 定义小于比较方法，用于优先队列  
    def __lt__(self, other):  
        return self.fn < other.fn
    
    # 定义等于比较方法  
    def __eq__(self, other):  
        return self.hash_value == other.hash_value
    
    # 定义不等于比较方法  
    def __ne__(self, other):  
        return not self.__eq__(other)

# 定义曼哈顿距离计算函数  
def manhattan_dis(cur_node, end_node):  
    # 获取当前节点的状态  
    cur_state = cur_node.state  
    # 获取目标节点的状态  
    end_state = end_node.state  
    # 初始化距离变量  
    dist = 0  
    # 获取状态的维度大小  
    N = len(cur_state)  
    # 遍历状态的每一个位置  
    for i in range(N):  
        for j in range(N):  
            # 如果当前位置的状态与目标位置的状态相同，则跳过  
            if cur_state[i][j] == end_state[i][j]:  
                continue  
            # 获取当前位置的数字（如果是0，表示空位）  
            num = cur_state[i][j]  
            # 如果是空位，则设定空位的位置为数组的最大坐标  
            if num == 0:  
                x = N - 1  
                y = N - 1  
            else:  
                # 计算数字在数组中的实际位置（x为行，y为列）  
                x = num // N  
                y = num - N * x - 1  
            # 计算曼哈顿距离并累加到总距离中  
            dist += (abs(x - i) + abs(y - j))  
    # 返回计算得到的曼哈顿距离  
    return dist

# 生成子节点函数  
def generate_child(cur_node, end_node, hash_set, open_table, dis_fn):  
    # 如果当前节点已经等于目标节点，则将其加入到OPEN列表中并返回  
    if cur_node == end_node:  
        heapq.heappush(open_table, end_node)  
        return  
      
    # 获取状态的大小（假设为N*N的二维数组）  
    num = len(cur_node.state)
    # 遍历当前状态的所有位置  
    for i in range(0, num):  
        for j in range(0, num):  
            # 如果当前位置不是空位（0表示空位）  
            if cur_node.state[i][j] != 0:  
                continue
            # 遍历四个可能的移动方向  
            for d in direction:  
                # 计算新的位置  
                x = i + d[0]  
                y = j + d[1]
                # 如果新位置越界，则跳过此次移动  
                if x < 0 or x >= num or y < 0 or y >= num:  
                    continue
                # 增加已访问节点数量  
                global SUM_NODE_NUM  
                SUM_NODE_NUM += 1  
                # 复制当前状态  
                state = copy.deepcopy(cur_node.state)
                # 交换空位和移动方向上的数字  
                state[i][j], state[x][y] = state[x][y], state[i][j]
                # 计算新状态的哈希值  
                h = hash(str(state))
                # 如果新状态的哈希值已经在哈希集合中，则跳过此次生成的子节点  
                if h in hash_set:  
                    continue
                # 将新状态的哈希值加入到哈希集合中  
                hash_set.add(h)
                # 计算新的gn值（从起点到当前状态的代价）  
                gn = cur_node.gn + 1
                # 计算新的hn值（启发式代价，由传入的dis_fn函数决定）  
                hn = dis_fn(cur_node, end_node)
                # 创建新的状态节点  
                node = State(gn, hn, state, h, cur_node)
                # 将新节点添加到当前节点的子节点列表中  
                cur_node.child.append(node)
                # 将新节点加入到OPEN列表中  
                heapq.heappush(open_table, node)

# 定义输出路径函数  
def print_path(node):  
    # 初始化步数  
    num = node.gn
    # 定义内部函数用于展示二维数组的状态  
    def show_block(block):  
        print("+-------------------+")  
        for b in block:  
            print(b)
    # 初始化栈，用于逆序存储路径上的状态  
    stack = []
    # 从当前节点开始，沿着父节点回溯，直到根节点  
    while node.par is not None:  
        stack.append(node.state)  
        node = node.par
    # 将根节点的状态也加入到栈中  
    stack.append(node.state)
    # 逆序弹出栈中的状态并展示  
    while len(stack) != 0:  
        t = stack.pop()  
        show_block(t) 
    # 返回步数  
    return num

# 定义A*算法  
def A_start(start, end, distance_fn, generate_child_fn, time_limit=10):  
    # 初始化根节点，起始代价为0，启发式代价为0，状态为起始状态，哈希值为起始状态的哈希值，父节点为None  
    root = State(0, 0, start, hash(str(BLOCK)), None)  
    # 初始化目标节点，代价和父节点与根节点类似，状态为目标状态，哈希值为目标状态的哈希值  
    end_state = State(0, 0, end, hash(str(GOAL)), None)  
    # 如果根节点就是目标节点，则打印提示信息  
    if root == end_state:  
        print("start == end !")  
    # 将根节点添加到OPEN列表中  
    OPEN.append(root)  
    # 将OPEN列表转换为堆结构，以便可以高效地取出代价最小的节点  
    heapq.heapify(OPEN)  
    # 初始化哈希集合，用于存储已访问节点的哈希值  
    node_hash_set = set()  
    # 将根节点的哈希值添加到哈希集合中  
    node_hash_set.add(root.hash_value)  
    # 记录算法开始运行的时间  
    start_time = datetime.datetime.now()
    # 当OPEN列表不为空时，继续循环  
    while len(OPEN) != 0:  
        # 取出OPEN列表中代价最小的节点  
        top = heapq.heappop(OPEN)  
        # 如果取出的节点是目标节点，则打印路径并返回步数  
        if top == end_state:  
            return print_path(top)  
        # 生成当前节点的所有子节点  
        generate_child_fn(cur_node=top, end_node=end_state, hash_set=node_hash_set,  
                         open_table=OPEN, dis_fn=distance_fn)  
        # 记录当前时间  
        cur_time = datetime.datetime.now()  
        # 如果算法运行时间超过了设定的时间限制，则打印提示信息、节点数量和步数，并返回-1表示超时  
        if (cur_time - start_time).seconds > time_limit:  
            print("Time running out, break ！")  
            print(f"Number of nodes: {SUM_NODE_NUM}")  
            return -1  
    # 如果循环结束仍未找到路径，则打印提示信息并返回-1表示无解  
    print("No road !")  
    return -1

# 读取数据作为原始状态  
def read_block(block, line, N):  
    # 定义一个正则表达式，用于匹配一行中的数字  
    pattern = re.compile(r'\d+')  
    # 使用正则表达式查找所有匹配的数字，并返回数字列表  
    res = re.findall(pattern, line)  
    t = 0  
    # 初始化临时列表，用于暂存每一行的数字  
    tmp = []  
    # 遍历找到的数字  
    for i in res:  
        # 计数器加1  
        t += 1  
        # 将数字添加到临时列表中  
        tmp.append(int(i))  
        # 如果计数器等于N，表示一行数字已经收集完毕  
        if t == N:  
            # 将临时列表添加到block中，并清空临时列表以便收集下一行数字  
            t = 0  
            block.append(tmp)  
            tmp = []

# 运行并输出结果
if __name__ == '__main__':
    try:
        # 尝试打开文件infile.txt进行读取
        file = open('./infile.txt', 'r')
    except IOError:
        # 如果文件打开失败，则打印错误信息并退出程序
        print('can not open file infile.txt !')
        exit(1)
    # 再次打开文件infile.txt
    f = open('./infile.txt')
    # 读取第一行，并取倒数第二个字符（应该是数字字符）转换为整数，作为后续处理中的NUMBER
    NUMBER = int(f.readline()[-2])
    # 初始化计数器n为1，用于生成目标状态GOAL
    n = 1
    # 根据NUMBER生成目标状态GOAL，是一个NUMBER*NUMBER的二维列表
    for i in range(NUMBER):
        l = []
        for j in range(NUMBER):
            l.append(n)
            n += 1
        GOAL.append(l)
    # 将目标状态GOAL的最后一个元素设置为0，表示终点位置
    GOAL[NUMBER - 1][NUMBER - 1] = 0
    # 逐行读取文件infile.txt的内容
    for line in f:
        # 初始化OPEN列表、BLOCK列表和SUM_NODE_NUM
        OPEN = []
        BLOCK = []
        # 调用read_block函数解析当前行line，生成起始状态BLOCK
        read_block(BLOCK, line, NUMBER)
        SUM_NODE_NUM = 0
        # 记录开始时间
        start_t = datetime.datetime.now()
        # 调用A_start函数进行A*算法搜索，返回路径长度length
        length = A_start(BLOCK, GOAL, manhattan_dis, generate_child, time_limit=10)
        # 记录结束时间
        end_t = datetime.datetime.now()
        # 如果找到了路径就打印路径长度、运行时间和节点数量
        if length != -1:
            print("+-------------------+")
            print(f"length = {length}")
            print(f"time = {(end_t - start_t).total_seconds()}s")
            print(f"Nodes = {SUM_NODE_NUM}")

运行结果

+-------------------+
[1, 6, 3]
[4, 5, 2]
[8, 7, 0]
+-------------------+
[1, 6, 3]
[4, 5, 0]
[8, 7, 2]
+-------------------+
[1, 6, 3]
[4, 0, 5]
[8, 7, 2]
+-------------------+
[1, 0, 3]
[4, 6, 5]
[8, 7, 2]
+-------------------+
[0, 1, 3]
[4, 6, 5]
[8, 7, 2]
+-------------------+
[4, 1, 3]
[0, 6, 5]
[8, 7, 2]
+-------------------+
[4, 1, 3]
[8, 6, 5]
[0, 7, 2]
+-------------------+
[4, 1, 3]
[8, 6, 5]
[7, 0, 2]
+-------------------+
[4, 1, 3]
[8, 0, 5]
[7, 6, 2]
+-------------------+
[4, 1, 3]
[0, 8, 5]
[7, 6, 2]
+-------------------+
[0, 1, 3]
[4, 8, 5]
[7, 6, 2]
+-------------------+
[1, 0, 3]
[4, 8, 5]
[7, 6, 2]
+-------------------+
[1, 3, 0]
[4, 8, 5]
[7, 6, 2]
+-------------------+
[1, 3, 5]
[4, 8, 0]
[7, 6, 2]
+-------------------+
[1, 3, 5]
[4, 8, 2]
[7, 6, 0]
+-------------------+
[1, 3, 5]
[4, 8, 2]
[7, 0, 6]
+-------------------+
[1, 3, 5]
[4, 0, 2]
[7, 8, 6]
+-------------------+
[1, 3, 5]
[4, 2, 0]
[7, 8, 6]
+-------------------+
[1, 3, 0]
[4, 2, 5]
[7, 8, 6]
+-------------------+
[1, 0, 3]
[4, 2, 5]
[7, 8, 6]
+-------------------+
[1, 2, 3]
[4, 0, 5]
[7, 8, 6]
+-------------------+
[1, 2, 3]
[4, 5, 0]
[7, 8, 6]
+-------------------+
[1, 2, 3]
[4, 5, 6]
[7, 8, 0]
+-------------------+
length = 22
time = 0.160433s
Nodes = 10827

不足的地方

在提供的代码片段中，虽然缺少了一些关键的实现细节（如A_start函数的内部逻辑、manhattan_dis和generate_child函数的定义等），但整体上可以看出程序是按照A算法的原理来设计和实现的。通过读取输入文件来初始化搜索问题，然后执行A搜索算法来找到最短路径，并最后输出搜索结果。