# Chapter2 数组与链表、二分查找、大O表示法

## 数组的实现

In [None]:
# 定义数组
alist = [1,1555,'数据结构',1.2,None,None,None]

# 数组按索引查找
item1 = alist[0]
print(item1)

In [None]:
# 数组中插入元素
def insert_item(alist,item,pos):
    key = len(alist)-1

    # 判断数组是否已满
    if alist[key] is None:
        while key > pos:
            # 互换列表内两位置上的元素
            alist[key],alist[key-1] = alist[key-1],alist[key]
            key -= 1
        alist[pos] = item
    else:
        return '数组已满，无法插入新元素'
    return alist

# 数组中删除元素
def delete_item(alist,pos):
    # 删除指定位置的元素
    alist[pos] = None

    key = pos + 1
    item_list = alist[key]
    # 前移指定位置后的所有元素
    while item_list is not None:
        # 互换列表内两位置上的元素
        alist[key],alist[key-1] = alist[key-1],alist[key]
        key += 1
        item_list = alist[key]
    return alist

In [None]:
insert_item(alist,'Python',1)
# delete_item(alist,1)

## 链表实现

In [1]:
# 单链表实现
class SingleNode():
    # 单链表的结点
    def __init__(self,item):
        # item存放数据元素
        self.item = item
        # next是下一个节点的标识
        self.next = None

class LinkList():
    # 单链表
    def __init__(self):
        self._head = None

    def is_empty(self):
        """判断链表是否为空"""
        return self._head == None

    def length(self):
        # 链表长度
        # cur初始时指向头结点
        cur = self._head
        count = 0
        # 尾结点指向None，当未到达尾部时
        while cur != None:
            count += 1
            # cur后移一个节点
            cur = cur.next
        return count

    def add(self,item):
        # 头部添加元素
        # 先创建一个保存item值的节点
        node = SingleNode(item)
        # 将新结点的链接域next指向头结点，即_head指向的位置
        node.next = self._head
        # 将链表的头_head指向新结点
        self._head = node

    def append(self,item):
        # 尾部添加元素
        node = SingleNode(item)
        # 先判断链表是否为空，若是空链表，则将_head指向新结点
        if self.is_empty():
            self._head = node
        # 若不为空，则找到尾部，将尾结点的next指向新结点
        else:
            cur = self._head
            while cur.next != None:
                cur = cur.next
            cur.next = node

    def insert(self, pos, item):
        """指定位置添加元素"""
        # 若指定位置为第一个元素之前，则执行头部插入
        if pos <= 0:
            self.add(item)
        # 若指定位置超过链表尾部，则执行尾部插入
        elif pos > (self.length() - 1):
            self.append(item)
        # 找到指定位置
        else:
            node = SingleNode(item)
            count = 0
            # pre用来指向指定位置pos的前一个位置pos-1，初始从头节点开始移动到指定位置
            pre = self._head
            while count < (pos - 1):
                count += 1
                pre = pre.next
            # 先将新节点node的next指向插入位置的节点
            node.next = pre.next
            # 将插入位置的前一个节点的next指向新节点
            pre.next = node

    def remove(self, item):
        """删除节点"""
        cur = self._head
        pre = None
        while cur != None:
            # 找到了指定元素
            if cur.item == item:
                # 如果第一个就是删除的节点
                if not pre:
                    # 将头指针指向头节点的后一个节点
                    self._head = cur.next
                else:
                    # 将删除位置前一个节点的next指向删除位置的后一个节点
                    pre.next = cur.next
                break
            else:
                # 继续按链表后移节点
                pre = cur
                cur = cur.next

    def travel(self):
        """遍历链表"""
        # 查看元素
        cur = self._head
        while cur != None:
            print(cur.item)
            cur = cur.next
        print("")

In [None]:
# 定义一个链表，加入元素
ll = LinkList()
ll.add(1)
ll.append(1555)
ll.append('数据结构')
ll.append(1)

# 查看元素
ll.travel()

# 插入元素
ll.insert(1,2)
ll.travel()

# 删除元素
ll.remove(2)
ll.travel()

## Q1:判断链表是否有环

用多种方式尝试解决这个问题：
- 直接遍历，存入哈希表
- 快慢指针，Floyd判圈算法

【法一：哈希存储】

In [7]:
def existLoop_hash(LinkList):
    """哈希法判断链表是否有环"""
    visited = set()
    current = LinkList._head
    while current:
        if current in visited:
            return True  # 有环
        visited.add(current)
        current = current.next
    return False  # 无环

def findLoopBeginNode_hash(LinkList):
    """哈希法查找环入口"""
    visited = set()
    current = LinkList._head
    while current:
        if current in visited:
            return current  # 当前节点是环入口
        visited.add(current)
        current = current.next
    return None  # 无环

In [5]:
# 测试哈希法
def test_hash_method():
    print("===== 测试哈希法 =====")

    # 测试用例1：无环链表
    link1 = LinkList()
    link1.append(1)
    link1.append(2)
    link1.append(3)
    print("链表1（无环）:")
    print("existLoop_hash:", existLoop_hash(link1))  # False
    print("findLoopBeginNode_hash:", findLoopBeginNode_hash(link1))  # None
    print()

    # 测试用例2：单节点自环
    link2 = LinkList()
    node = SingleNode(1)
    link2._head = node
    node.next = node  # 自环
    print("链表2（单节点自环）:")
    print("existLoop_hash:", existLoop_hash(link2))  # True
    print("findLoopBeginNode_hash:", findLoopBeginNode_hash(link2).item)  # 1
    print()

    # 测试用例3：多节点有环（环入口在中间）
    link3 = LinkList()
    node1 = SingleNode(1)
    node2 = SingleNode(2)
    node3 = SingleNode(3)
    node4 = SingleNode(4)
    link3._head = node1
    node1.next = node2
    node2.next = node3
    node3.next = node4
    node4.next = node2  # 环入口是节点2
    print("链表3（多节点有环，入口在中间）:")
    print("existLoop_hash:", existLoop_hash(link3))  # True
    print("findLoopBeginNode_hash:", findLoopBeginNode_hash(link3).item)  # 2
    print()

    # 测试用例4：多节点有环（环入口在头部）
    link4 = LinkList()
    node1 = SingleNode(1)
    node2 = SingleNode(2)
    node3 = SingleNode(3)
    link4._head = node1
    node1.next = node2
    node2.next = node3
    node3.next = node1  # 环入口是节点1
    print("链表4（多节点有环，入口在头部）:")
    print("existLoop_hash:", existLoop_hash(link4))  # True
    print("findLoopBeginNode_hash:", findLoopBeginNode_hash(link4).item)  # 1
    print()

    # 测试用例5：无环空链表
    link5 = LinkList()
    print("链表5（空链表）:")
    print("existLoop_hash:", existLoop_hash(link5))  # False
    print("findLoopBeginNode_hash:", findLoopBeginNode_hash(link5))  # None
    print()

In [6]:
test_hash_method()

===== 测试哈希法 =====
链表1（无环）:
existLoop_hash: False
findLoopBeginNode_hash: None

链表2（单节点自环）:
existLoop_hash: True
findLoopBeginNode_hash: 1

链表3（多节点有环，入口在中间）:
existLoop_hash: True
findLoopBeginNode_hash: 2

链表4（多节点有环，入口在头部）:
existLoop_hash: True
findLoopBeginNode_hash: 1

链表5（空链表）:
existLoop_hash: False
findLoopBeginNode_hash: None



【法二：快慢指针】

通过快慢指针，可以确定链表中间节点，可用于二分查找等算法

只要是质数都可以做快指针，但是走的步数必须小于环。环最小3，所以最好用的就是2

In [None]:
# 快慢指针
slowNode = LinkList()
fastNode = LinkList()

while(fastNode != None and fastNode.next != None):
    slowNode = slowNode.next
    fastNode = fastNode.next.next

# 运行至此，各结点情况：
# 奇数节点：fastNode为None，slowNode为中间节点
# 偶数结点：fast.next为None，slowNode的为前半段最后一个节点

In [None]:
# 判断是否有环
def existLoop(LinkList):
    if not LinkList._head or not LinkList._head.next:
        return False

    slow = LinkList._head
    fast = LinkList._head

    while fast and fast.next:
        slow = slow.next
        fast = fast.next.next
        if slow == fast:
            return True
    return False

In [None]:
# 判断环入口
def findLoopBeginNode(LinkList):
    # 链表为空或者只有一个节点时才无环
    if not existLoop(LinkList):
        return None

    slow = LinkList._head
    fast = LinkList._head

    while fast and fast.next:
        slow = slow.next
        fast = fast.next.next
        if slow == fast:
            break # 此时slow和fast在环内相遇

    fast = LinkList._head
    while slow != fast:
        slow = slow.next
        fast = fast.next
    return slow # or fast

In [None]:
# 测试 existLoop() 和 findLoopBeginNode()
def test_linked_list_cycle():
    # 测试用例1：无环链表
    print("=== 测试1：无环链表 ===")
    link1 = LinkList()
    link1.append(1)
    link1.append(2)
    link1.append(3)
    print("链表元素：1 -> 2 -> 3")
    print("existLoop 结果:", existLoop(link1))  # 应返回 False
    print("findLoopBeginNode 结果:", findLoopBeginNode(link1))  # 应返回 None
    print()

    # 测试用例2：单节点自环
    print("=== 测试2：单节点自环 ===")
    link2 = LinkList()
    node = SingleNode(1)
    link2._head = node
    node.next = node  # 自环
    print("链表元素：1 -> 1 (自环)")
    print("existLoop 结果:", existLoop(link2))  # 应返回 True
    print("findLoopBeginNode 结果:", findLoopBeginNode(link2).item)  # 应返回 1
    print()

    # 测试用例3：多节点有环（环入口在中间）
    print("=== 测试3：多节点有环（环入口在中间） ===")
    link3 = LinkList()
    node1 = SingleNode(1)
    node2 = SingleNode(2)
    node3 = SingleNode(3)
    node4 = SingleNode(4)
    link3._head = node1
    node1.next = node2
    node2.next = node3
    node3.next = node4
    node4.next = node2  # 环入口是节点2
    print("链表元素：1 -> 2 -> 3 -> 4 -> 2 (环)")
    print("existLoop 结果:", existLoop(link3))  # 应返回 True
    print("findLoopBeginNode 结果:", findLoopBeginNode(link3).item)  # 应返回 2
    print()

    # 测试用例4：多节点有环（环入口在头部）
    print("=== 测试4：多节点有环（环入口在头部） ===")
    link4 = LinkList()
    node1 = SingleNode(1)
    node2 = SingleNode(2)
    node3 = SingleNode(3)
    link4._head = node1
    node1.next = node2
    node2.next = node3
    node3.next = node1  # 环入口是节点1
    print("链表元素：1 -> 2 -> 3 -> 1 (环)")
    print("existLoop 结果:", existLoop(link4))  # 应返回 True
    print("findLoopBeginNode 结果:", findLoopBeginNode(link4).item)  # 应返回 1
    print()

    # 测试用例5：无环空链表
    print("=== 测试5：无环空链表 ===")
    link5 = LinkList()
    print("链表元素：空")
    print("existLoop 结果:", existLoop(link5))  # 应返回 False
    print("findLoopBeginNode 结果:", findLoopBeginNode(link5))  # 应返回 None
    print()

# 运行测试
test_linked_list_cycle()

# 二分查找

In [None]:
def sequential_search(alist, item):
    """利用顺序查找在给定无序数组中查询特定数字
    输入：
    alist：包含所有待查询数字的list
    item：查询的数字
    输出：
    pos：查询数字在数组中的索引"""

    pos = 0  # 初始化查询位置的索引
    while pos < len(alist):
        # 如果当前索引的数字等于查询的数字，返回索引
        if alist[pos] == item:
            return pos, pos+1  # 返回(位置, 比较次数)
        # 如果当前数字不等于查询的数字，更新索引
        else:
            pos += 1
    return None, pos  # 未找到时返回None和总比较次数

# 初始化数组，生成1-99的奇数
alist = [2*i+1 for i in range(0, 50)]

# 执行查询并存储结果
pos1, epoch1 = sequential_search(alist, 51)
pos2, epoch2 = sequential_search(alist, 52)

# 打印输出结果
print(pos1, epoch1, pos2, epoch2)

In [None]:
def order_sequential_search(alist, item):
    """利用顺序查找在给定有序数组中查询特定数字
    输入：
    alist: 包含所有待查询数字的list
    item: 查询的数字
    输出：
    pos: 查询数字在数组中的索引"""

    # 初始化查询位置的索引
    pos = 0
    while pos < len(alist):
        # 如果索引在数组中对应的数字等于查询的数字，返回索引
        if alist[pos] == item:
            return pos, pos
        # 如果索引在数组中对应的数字不等于查询的数字，更新
        elif alist[pos] > item:  # 有序数组特有优化
            return None, pos
        else:
            pos += 1
    return None, pos

# 初始化数组，生成1-99的奇数
alist = [2*i+1 for i in range(0, 50)]

# 查询数组中含有的数字
pos1, epoch1 = order_sequential_search(alist, 51)
# 查询数组中没有的数字
pos2, epoch2 = order_sequential_search(alist, 52)

print(pos1, epoch1, pos2, epoch2)

## Q2:找出最小下标

给定一个排好序的数组nums = \[1, 1, 2, 2, 2, 2, 3, 4, 5, 6, 7, 8]，找到第一个出现所查找数字
的下标。如果没有返回-1。

In [None]:
def search(list,num):
    left , right = 0, len(list)-1
    while left+1 < right:
        mid = (left+right)//2
        if list[mid] >= num:
            right = mid
        elif list[mid] < num:
            left = mid
    if list[left] == num:
        return left
    if list[right] == num:
        return right
    return -1

nums = [1, 1, 2, 2, 2, 2, 3, 4, 5, 6, 7, 8]
print(search(nums,2))
print(search(nums,12))

## Q3:空字符串列表中找下标

在一个存在很多空字符串中的列表nums = \[1, '', 2, '', '', '', '', 3, 4, '', 5, '', 6]中，找到想要找的数的下标

In [None]:
def search(nums, n):
    """在可能包含空字符串的有序列表中查找目标值
    参数：
        nums: 可能包含空字符串的有序列表
        n: 要查找的目标值
    返回：
        目标值的索引（未找到返回-1）"""

    if len(nums) == 0:
        return -1

    left = 0
    right = len(nums) - 1

    while left + 1 < right:
        # 跳过右侧空字符串
        while left + 1 < right and nums[right] == "":
            right -= 1
        if right < left:
            return -1

        mid = (right + left) // 2  # 修正为整数除法

        # 跳过中间空字符串
        while nums[mid] == "":
            mid += 1

        if nums[mid] == n:
            return mid
        elif nums[mid] < n:
            left = mid + 1
        else:
            right = mid - 1

    # 最终检查左右边界
    if nums[left] == n:
        return left
    if nums[right] == n:
        return right

    return -1

nums = [1, '', 2, '', '', '', '', 3, 4, '', 5, '', 6]
print(search(nums,3))