算法中,往往都会涉及数据结构的选择和使用。 本篇博文主要描述一些常用的数据结构。
1.字符串、数组(String & Array) 字符串转化 数组和字符串是最基本的数据结构,在很多编程语言中都有着十分相似的性质,而围绕着它们的算法面试题也是最多的。
2.队列(Queue) 特点:和栈不同,队列的最大特点是先进先出(FIFO),就好像按顺序排队一样。对于队列的数据来说,我们只允许在队尾查看和添加数据,在队头查看和删除数据。
应用场景:直观来看,当我们需要按照一定的顺序来处理数据,而该数据的数据量在不断地变化的时候,则需要队列来帮助解题。在算法面试题当中,广度优先搜索(Breadth-First Search)是运用队列最多的地方,我们将在第 06 课时中详细介绍。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 DEFAULT_CAPACITY = 10 class Empty (Exception) : pass class ArrayQueue (object) : def __init__ (self) : self._data = [None ] * DEFAULT_CAPACITY self._size = 0 self._front = 0 def __len__ (self) : return self._size def is_empty (self) : """Return True if the queue is empty.""" return self._size == 0 def first (self) : """Return the element at the front of the queue.""" if self.is_empty(): raise Empty('Queue is empty.' ) return self._data[self._front] def dequeue (self) : """Remove and return the first element of the queue.""" if self.is_empty(): raise Empty('Queue is empty.' ) answer = self._data[self._front] self._data[self._front] = None self._front = (self._front + 1 ) % len(self._data) self._size -= 1 return answer def enqueue (self, e) : """Add an element to the back of the queue.""" if self._size == len(self._data): self._resize(2 * len(self._data)) avail = (self._front + self._size) % len(self._data) self._data[avail] = e self._size += 1 def _resize (self, cap) : """Resize a new list of capacity >= len(self).""" old = self._data self._data = [None ] * cap walk = self._front for k in range(self._size): self._data[k] = old[walk] walk = (1 + walk) % len(old) self._front = 0
3.双端队列(Deque) 特点:双端队列和普通队列最大的不同在于,它允许我们在队列的头尾两端都能在 O(1) 的时间内进行数据的查看、添加和删除。
4.链表(LinkedList) 单链表:链表中的每个元素实际上是一个单独的对象,而所有对象都通过每个元素中的引用字段链接在一起。
1 2 3 4 5 6 class ListNode (object) : __slots__ = ('val' , 'next' ) def __init__ (self, x) : self.val = x self.next = None
4.1.链表的优缺点 链表的优点如下:
能在 O(1) 时间内删除或者添加元素,前提是该元素的前一个元素已知,当然也取决于是单链表还是双链表,在双链表中,如果已知该元素的后一个元素,同样可以在 O(1) 时间内删除或者添加该元素。
查询第 k 个元素需要 O(k) 时间。
4.2.应用场景 如果要解决的问题里面需要很多快速查询,链表可能并不适合;
5.栈(Stack) 特点:栈的最大特点就是后进先出(LIFO)。对于栈中的数据来说,所有操作都是在栈的顶部完成的,只可以查看栈顶部的元素,只能够向栈的顶部压⼊数据,也只能从栈的顶部弹出数据。
实现:利用一个单链表来实现栈的数据结构。而且,因为我们都只针对栈顶元素进行操作,所以借用单链表的头就能让所有栈的操作在 O(1) 的时间内完成。
如果打算用一个数组外加一个指针来实现相似的效果,那么,一旦数组的长度发生了改变,哪怕只是在最后添加一个新的元素,时间复杂度都不再是 O(1),而且,空间复杂度也得不到优化。
注意:栈是许多 LeetCode 中等难度偏上的题目里面经常需要用到的数据结构,掌握好它是十分必要的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 class ArrayStack (object) : def __init__ (self) : self._data = [] self._min_data = [] self._max_data = [] self.minVal = None self.maxVal = None def __len__ (self) : return len(self._data) def _set_min_value (self, val) : """设置最小值""" if not self._min_data: self._min_data.append(val) self.minVal = val else : if val <= self.minVal: self._min_data.append(val) self.minVal = val print('min-list: ' , self._min_data, end=' ' ) def _set_max_value (self, val) : """设置最大值""" if not self._max_data: self._max_data.append(val) self.maxVal = val else : if val >= self.maxVal: self._max_data.append(val) self.maxVal = val print('max-list: ' , self._max_data) def _update_min_value (self, val) : """更新最小值""" if val == self.minVal: self._min_data.pop() if not self._min_data: self.minVal = None else : self.minVal = self._min_data[-1 ] else : if val in self._min_data: self._min_data.remove(val) print('min-list: ' , self._min_data, end=' ' ) def _update_max_value (self, val) : """更新最大值""" if val == self.maxVal: self._max_data.pop() if not self._max_data: self.maxVal = None else : self.maxVal = self._max_data[-1 ] else : if val in self._max_data: self._max_data.remove(val) print('max-list: ' , self._max_data) def is_empty (self) : """Return True if the stack is empty.""" return len(self._data) == 0 def pop (self) : """Remove and return the element from the top of the stack.""" if self.is_empty(): raise Empty('Stack is empty.' ) pop_val = self._data.pop() self._update_min_value(pop_val) self._update_max_value(pop_val) return pop_val def push (self, e) : """Add an element e to the top of the stack.""" self._data.append(e) self._set_min_value(e) self._set_max_value(e) def top (self) : """Return the element at the top of the stack.""" if self.is_empty(): raise Empty('Stack is empty.' ) return self._data[-1 ]
6.树(Tree) 树的结构十分直观,而树的很多概念定义都有一个相同的特点:递归,也就是说,一棵树要满足某种性质,往往要求每个节点都必须满足。例如,在定义一棵二叉搜索树时,每个节点也都必须是一棵二叉搜索树。
树的形状 在面试中常考的树的形状有:普通二叉树、平衡二叉树、完全二叉树、二叉搜索树、四叉树(Quadtree)、多叉树(N-ary Tree)。
对于一些特殊的树,例如红黑树(Red-Black Tree)、自平衡二叉搜索树(AVL Tree),一般在面试中不会被问到,除非你所涉及的研究领域跟它们相关或者你十分感兴趣,否则不需要特别着重准备。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 class Tree (object) : """创建树""" default_chars = [chr(c) for c in range(65 , 91 )] def __init__ (self, seq=None) : """ 初始化 :param seq: 二叉树元素序列 """ seq = self.default_chars if seq is None else seq self.chars = seq def create (self) : """执行创建""" tree = self._recursive_create_node(self.chars) return tree def _recursive_create_node (self, seq) : """递归创建节点""" n = len(seq) if n == 0 : return None i = n // 2 return Node(seq[i], self._recursive_create_node(seq[:i]), self._recursive_create_node(seq[i + 1 :]))
前序遍历(Preorder Traversal)
1 2 3 4 5 6 7 8 9 10 def pre_order (tree, lst=[]) : """前序遍历: 根->左->右""" if tree is None : return lst.append(tree.data) self.pre_order(tree.left, lst) self.pre_order(tree.right, lst) return lst
中序遍历(Inorder Traversal)
1 2 3 4 5 6 7 8 9 10 def mid_order (tree, lst=[]) : """中序遍历: 左->根->右""" if tree is None : return self.mid_order(tree.left, lst) lst.append(tree.data) self.mid_order(tree.right, lst) return lst
后序遍历(Postorder Traversal)
1 2 3 4 5 6 7 8 9 10 def post_order (tree, lst=[]) : """后序遍历: 左->右->根""" if tree is None : return self.post_order(tree.left, lst) self.post_order(tree.right, lst) lst.append(tree.data) return lst
广度遍历(Breadth traversal)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 def level_order (tree) : """广度遍历""" lst = list() if tree is None : return lst q = list() q.append(tree) while len(q) > 0 : node = q.pop(0 ) lst.append(node.data) if node.left: q.append(node.left) if node.right: q.append(node.right) return lst