本文始发于个人公众号:TechFlow,原创不易,求个关注
链接
难度
Hard
描述
Merge k sorted linked lists and return it as one sorted list. Analyze and
describe its complexity.
给定K个有序链表,要求将它所有的元素归并到一个链表,并且有序。
样例:
Input: [ 1->4->5, 1->3->4, 2->6 ] Output: 1- >1->2->3->4->4->5->6
题解
按照惯例,我们还是先来看最简单的解法,也就是暴力法。
暴力
这题当中,暴力的方法也很简单,非常简单粗暴,那就是先把所有元素取出来,排序之后再放到链表当中去。但是这么做说实话有点脱裤子放屁,我们分析一下复杂度也会发现,假设所有的元素个数是n,那么最后的复杂度应该就是排序所消耗的复杂度,也就是\(O(nlogn)\),和K没有一点关系,而且我们也完全没有用上这K个链表当中的元素都是有序的这个信息,显然这是不科学的。
我们对上面的纯暴力方法稍稍做一些优化,想办法把K个链表当中元素有序的信息用上。用上的方法也很简单,我们之前做归并排序的时候曾经做过两个数组的归并,我们用同样的方法,只不过我们这次换成是K个链表而已。也就是说我们每次遍历这K个链表的头元素,从其中取出最小的那个元素插入最后的结果链表当中,当所有链表为空的时候,说明所有的元素已经归并完了,那么进行返回。
我们来试着写一下代码:
class Solution: def mergeKLists(self, lists: List[ListNode]) -> ListNode: import sys ret = ListNode(0) pnt = ret while True: mini = sys.maxsize node = None # 遍历所有的链表 for i, l in enumerate(lists): if l is None: continue if l.val < mini: mini = l.val node = i # 如果node为None,说明所有的元素都已经归并结束了 if node is None: break pnt.next = ListNode(mini) pnt = pnt.next lists[node] = lists[node].next return ret.next
这种算法的复杂度是多少呢?稍微算一下就知道,我们每一次选择数的时候,都需要遍历K个链表的头指针。一共有n个元素,所以总体的复杂度是\(O(nk)\)。和之前暴力的方法\(O(nlogn)\)相比如何呢?其实是半斤八两,这两者谁大谁小完全取决于K和\(logn\)的大小关系。一般来说n不会超过一千万,所以\(logn\)不会很大,粗略估算,不会超过30,而K很有可能超过30。也就是说大部分情况下这种方法的运算时间要比暴力还要长。
看起来这个用上了链表内元素大小关系浓眉大眼的归并法,还不如之前简单粗暴的暴力来得管用。实在是有点粉刺。
归并
我们回想一下从前,在之前的问题当中,我们遇到比较多的往往是两个数组的归并,这次是K个链表,因此复杂度增加了许多。那么我们能不能把这K个链表看成是两两链表的组合呢?我们每次将这些链表两两分组,然后归并之后再次两两分组归并,直到最后只剩下一个链表为止,这种方案会不会更优一些呢?
我们画张图来看看这一过程:
我们横向来看,在每一次merging阶段当中,我们都遍历了全部的元素,所以每一层总体的复杂度是\(O(n)\)。那么,我们一共又遍历了多少层呢?也不难,我们每次merging,链表的数量都会减少一半。一共有K个链表,那么显然,应该要merging \(logK\)次,也就是说有\(logK\)个merging阶段,所以总体的复杂度是\(nlogK\)。由于K不会太大,所以这种方法显然要优于\(nlogn\)和\(nK\).
我们先来写出两个链表归并的代码,之后再递归的形式调用即可:
class Solution: def mergeTwoList(self, l1, l2): ret = ListNode(0) pnt = ret while True: """ 链表没办法像数组那样在末尾插入标兵了 所以只能人工判断是否为空的情况 """ if l1 is None and l2 is None: break if l1 is None: pnt.next = ListNode(l2.val) pnt = pnt.next l2 = l2.next elif l2 is None: pnt.next = ListNode(l1.val) pnt = pnt.next l1 = l1.next else: if l1.val < l2.val: pnt.next = ListNode(l1.val) l1 = l1.next else: pnt.next = ListNode(l2.val) l2 = l2.next pnt = pnt.next return ret.next def dfs(self, lists, l, r): """ 递归合并K个链表 这里的l和r维护的是闭区间 """ if l > r: return None if l == r: return lists[l] else: mid = (l + r) // 2 return self.mergeTwoList(self.dfs(lists, l, mid), self.dfs(lists, mid+1, r)) def mergeKLists(self, lists: List[ListNode]) -> ListNode: # 传入l=0, r=len(lists)-1,因为是闭区间 return self.dfs(lists, 0, len(lists)-1)
优先队列
到这里还没有结束,下面要介绍的是可以说是我个人觉得这题最棒的解法了,就是使用我们之前说的优先队列。还记得吗,优先队列可以自动保证队列当中的元素有序。只要利用优先队列,然后将当前第一个元素作为优先级,让优先队列帮我们维护队列当中的顺序。通过使用优先队列,我们的代码无论是可读性还是编码复杂度都会大大降低。
如果有新关注的,或者是已经遗忘了优先队列用法的同学可以点击下方链接,回顾一下优先队列的用法:
class Solution: def mergeKLists(self, lists: List[ListNode]) -> ListNode: class Node: """ 存储在优先队列当中的节点 """ def __init__(self, val, arr): self.val = val self.arr = arr # 重载判断大小的比较函数 def __lt__(self, other): return self.val < other.val import heapq arr = [] # 将所有链表插入优先队列当中 for l in lists: if l is not None: heapq.heappush(arr, Node(l.val, l.next)) ret = ListNode(0) pnt = ret while len(arr) > 0: # 从优先队列头部获取元素,需要注意,pop之后元素会从队列中删除 node = heapq.heappop(arr) val, l = node.val, node.arr pnt.next = ListNode(val) pnt = pnt.next # 获取完头部元素之后,将剩下的链表插入回队列当中 if l is not None: heapq.heappush(arr, Node(l.val, l.next)) return ret.next
这种方法从代码复杂度上要比上一种要小很多,但是我们来分析一下会发现,对于优先队列而言,每次插入的复杂度是\(logn\),由于我们一共有K个链表,所以插入的复杂度是\(logK\),一共有n个元素,所以最终的复杂度依然是\(nlogK\)和归并的方法是一样的。但是数据结构的使用简化了我们计算的过程,这也是我们之所以学习各种数据结构的原因和意义。
今天这道题呢虽然挂的难度是Hard,但其实并不难,哪怕是我们暴力求解都可以通过。因此希望大家不要被它上面写的难度所吓到,另外,这题对于优先队列的应用也非常经典,非常值得学习。
今天的文章就是这些,如果觉得有所收获,请顺手扫码点个关注吧,你们的举手之劳对我来说很重要。
来源:https://www.cnblogs.com/techflow/p/12320231.html