1.Algorithm:每周至少做一个 leetcode 的算法题
2.Review:阅读并点评至少一篇英文技术文章
3.Tip:学习至少一个技术技巧
4.Share:分享一篇有观点和思考的技术文章
以下是各项的情况:
Algorithm
链接:[LeetCode-19]-remove-nth-node-from-end-of-list
题意:
给定一个链表: 1->2->3->4->5, 和 n = 2. 当删除了倒数第二个节点后,链表变为 1->2->3->5.
分析:
用快慢指针,快指针先移 n 个节点。
一起移动,两指针之间一直保持 n 个节点,当快指针到链表底了,操作慢指针,删除要删除的元素
时间复杂度:O(n)O(n)
class Solution { public ListNode removeNthFromEnd(ListNode head, int n) { if (head == null || n < 1) return head; // 给个负数 万一出错好排查,因为list一般给的正的 ListNode r = new ListNode(-1); r.next = head; ListNode slow = r; // 慢指针 // 快指针 ListNode fast = r; for (int i = 0; i < n; i++) { fast = fast.next; } if (fast == null){ return head; } while (fast.next != null) { fast = fast.next; slow = slow.next; } slow.next = slow.next.next; return r.next; } }
以下是看见论坛里别人发的 搬运(copy)过来记录下来
让前面的指针先移动n步,之后前后指针共同移动直到前面的指针到尾部为止
首先设立预先指针 pre,预先指针是一个小技巧,在第2题中进行了讲解
设预先指针 pre 的下一个节点指向 head,设前指针为 start,后指针为 end,二者都等于 pre
start 先向前移动n步
之后 start 和 end 共同向前移动,此时二者的距离为 n,当 start 到尾部时,end 的位置恰好为倒数第 n 个节点
因为要删除该节点,所以要移动到该节点的前一个才能删除,所以循环结束条件为 start.next != null
删除后返回 pre.next,为什么不直接返回 head 呢,因为 head 有可能是被删掉的点
时间复杂度:O(n)O(n)
class Solution { public ListNode removeNthFromEnd(ListNode head, int n) { ListNode pre = new ListNode(0); pre.next = head; ListNode start = pre, end = pre; while(n != 0) { start = start.next; n--; } while(start.next != null) { start = start.next; end = end.next; } end.next = end.next.next; return pre.next; } }
Review
分享 JVM内存模型
JVM自诞生就是为了实现“编写一次,随处运行 ”的目的 。 Sun Microsystems 创建了JVM -- 对底层OS的抽象,解释了编译的Java代码 。 JVM是JRE(Java运行环境)的核心组件,创建运行Java代码,但现在可使用其他语言(Scala,Groovy,JRuby,Closure 等等 ......)
分享的这篇 主要讲的就是 JVM 的 “运行数据区域” (Runtime Data Areas)
Contents [hide]
先总体介绍了下有哪几部分知识点组成 ,
基于堆栈的体系结构 , 然后做了简要的介绍,举了例子 :(因为觉得已经忘完了有必要复习所以记录如下 )
举例 栈里计算 3+4
如果要在字节码中添加3和4:
- 首先在操作数堆栈中压入3和4。
- 然后调用iadd指令。
- iadd将弹出操作数堆栈的最后2个值。
- 将int结果(3 + 4)压入操作数堆栈,以供其他操作使用。
接下来介绍了字节码 和 操作
(记录下:)
public class Test { public static void main(String[] args) { int a =1; int b = 15; int result = add(a,b); } public static int add(int a, int b){ int result = a + b; return result; } }
“ javac Test.java”命令在Test.class中生成一个字节码。由于Java字节码是二进制代码,因此人类无法读取。Oracle在其JDK javap中提供了一个工具,该工具可以将二进制字节码转换为JVM规范中易于阅读的带有 标签的操作代码集。
命令“ javap -verbose Test.class”给出以下结果:
Classfile /C:/TMP/Test.class Last modified 1 avr. 2015; size 367 bytes MD5 checksum adb9ff75f12fc6ce1cdde22a9c4c7426 Compiled from "Test.java" public class com.codinggeek.jvm.Test SourceFile: "Test.java" minor version: 0 major version: 51 flags: ACC_PUBLIC, ACC_SUPER Constant pool: #1 = Methodref #4.#15 // java/lang/Object."<init>":()V #2 = Methodref #3.#16 // com/codinggeek/jvm/Test.add:(II)I #3 = Class #17 // com/codinggeek/jvm/Test #4 = Class #18 // java/lang/Object #5 = Utf8 <init> #6 = Utf8 ()V #7 = Utf8 Code #8 = Utf8 LineNumberTable #9 = Utf8 main #10 = Utf8 ([Ljava/lang/String;)V #11 = Utf8 add #12 = Utf8 (II)I #13 = Utf8 SourceFile #14 = Utf8 Test.java #15 = NameAndType #5:#6 // "<init>":()V #16 = NameAndType #11:#12 // add:(II)I #17 = Utf8 com/codinggeek/jvm/Test #18 = Utf8 java/lang/Object { public com.codinggeek.jvm.Test(); flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 3: 0 public static void main(java.lang.String[]); flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=4, args_size=1 0: iconst_1 1: istore_1 2: bipush 15 4: istore_2 5: iload_1 6: iload_2 7: invokestatic #2 // Method add:(II)I 10: istore_3 11: return LineNumberTable: line 6: 0 line 7: 2 line 8: 5 line 9: 11 public static int add(int, int); flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=3, args_size=2 0: iload_0 1: iload_1 2: iadd 3: istore_2 4: iload_2 5: ireturn LineNumberTable: line 12: 0 line 13: 4 }
然后是重点 : 运行数据区
介绍了原理(本质是堆)
介绍了方法范围
方法区域是所有Java虚拟机线程之间共享的内存。在虚拟机启动时创建的,并由类加载器从字节码加载。只要加载它们的类加载器处于活动状态,方法区域中的数据就会保留在内存中。
方法区域存储:
- 类信息(字段/方法的数量,超类名称,接口名称,版本等)
- 方法和构造函数的字节码。
- 每个类加载的运行时常量池。
规范:不强制在堆中实现方法。例如,在 JAVA7 之前,Oracle HotSpot 使用一个名为 PermGen 的区域来存储“方法区域”。PermGen 区域 与 Java 堆(以及像堆一样由 JVM 管理的内存)是连续的,并且被限制为默认空间 64MB(由参数-XX:MaxPermSize修改)。从Java 8开始,HotSpot 现在将“方法区域”存储在称为 Metaspace 的隔离开的本机内存空间中,最大可用空间是总可用系统内存。
注意:方法区域不能超过最大大小。如果超过此限制,JVM将抛出 OutOfMemoryError。
介绍了运行时常量池
该池是“方法区域”的子部分。由于它是元数据的重要组成部分,因此Oracle规范描述了“方法区域”之外的运行常量池。对于每个加载的类/接口,此常量池都会增加。该池就像常规编程语言的符号表。换句话说,当引用类,方法或字段时,JVM使用运行时常量池在内存中搜索实际地址。它还包含常量值,例如字符串文字或常量图元。
String myString1 = “This is a string litteral”; static final int MY_CONSTANT=2;
介绍了 PC寄存器 (有空翻翻组成原理 对照下)
反正就是为了记录当前正在执行的Java虚拟机指令(在方法区域中)的地址
介绍了 JAVA虚拟机堆栈(线程)还有 堆在 JVM 里工作原理
这里打个断点 , 需要补充上工作原理
最后说(线程中)本机方法堆 是由JNI(Java本机接口)调用的本机代码的堆栈?? 没看懂 ,估计翻的不对 。
Tip
为什么一般数组都是从0开始编号?(重温数据结构)
首先 重温数组概念 :
1. 数组(Array)就是一种线性表数据结构,用一组连续内存空间来存储一组具有相同类型的数据 。
线性表结构 : 数组,链表,队列,栈 非线性表 : 比如二叉树,堆,图等
2. 连续的内存空间和相同类型的数据
因为这两个特性或者说是限制,拥有一个性质 : “随机访问”。 顾名思义 , 可以随机地去访问数据 , 但相应的, 让数组的很多操作变的非常低效, 比如想在数组中删除,插入一个数据 , 运气不好就必须后移大量数据 。
拓展 : 因为当插入一个新元素时,如果插入末尾,那么此时时间复杂度为O(1),所以如果要将某个数组插入到第K个位置,为了避免大量的数据迁移,我们有一个简单的方法就是:直接将第K位置数据搬移到数组的最后,把新元素直接放入到第K个位置 。 这种处理思想也会在快速排序中使用到 。
同理 , 删除操作 , 比如数组A[10]删除前三个元素 , 为了避免后面元素要搬移三次 ,我们可以先记录下已经删除数据 . 每次删除操作并不是真正的搬移数据,只是记录数据已经被删除 。 当数组没有更多空间去存储数据时候, 我们才
触发真正的删除操作 , 删掉前三个元素 , 剩下原数组其他元素向前移动三个位置 即可 。 而这种思路正是JVM标记清楚垃圾回收算法的核心思想 。
其次 我们需要警惕数组的访问越界问题
例如 : 下面一段C语言代码 乍看上去没有问题
int main(int args,char* arg[]) { int i = 0 ; int arr[3] = {0}; for(; i<=3 ; i++) { arr[i] = 0; printf("hello world\n"); } return 0 ; }
看起来会是输出三次hello world , 实际上是无线循环打印hello world ,这是为什么 ?
实际因为 数组大小为3 : A[0] , A[1 , A[2] 。 而代码中for循环的结束条件写成了 i<=3 而非 i<3 , 导致当i=3时候 , A[3]访问越界 。 C 语言中 , 只要不是访问首先的内存 ,所有的内存空间都是可以自由访问的 。 根据数组寻址公式 , A[3]也会被定为到某块不属于数组的内存地址上 , 而这个地址如果正好是存储变量 i 的内存地址 , 那么A[3]=0 就相当于 i=0 , 就会导致代码无限循环 。
数组越界在C语言是因为没有规定数组访问越界时候 , 编译器应该如何处理 。因为 ,访问数组的本质就是访问一段连续内存 , 只要数组通过偏移计算得到的内存地址可用 , 那么程序就可能不会报任何错误 。 而JAVA就不会像C一样 , 把数组检查的工作丢给程序员去判断 , 也因此会出现我们日常中头疼仅次于java.lang.NullPointerException: null 的 错误异常 : java.lang.ArrayhIndexOutOfBoundsException 。
比如 这段代码 :
int[] a = new int[3]; a[3] = 10 ;
就会抛出java.lang.ArrayhIndexOutOfBoundsException
最后 回到提出的问题 : 这些都了解后 就可以来思考 为什么数组要从0开始编号 , 而非从1 ?
从数组的内存模型来看 , 下标意味着"偏移"(offset) 。如果用 A 来表示数组的首地址 , A[0] 代表偏移为0 的位置 , 即是首地址 ,而 A[K] 就代表偏移K个type_size的位置 ,所以 计算 A[K]的内存地址 :
A[K]_address = base_address + K * type_size
但是从1开始计数的话 , 计算 A[K]的内存地址 的公式就变为 :
A[K]_address = base_address + (K-1) * type_size
从1开始编号 , 每次随机访问数组元素都多了一次减法运算 , 对于 CPU 来说 , 就是多了一次减法指令 。 为了提高效率 , 减少这一次不必要的减法操作 , 数组从0 开始编号变成约定俗成的 ,甚至是默认的规则 。 另一方面也是因为历史原因 : C语言设计就是从0开始编号 ,其他语言为了减少程序员学习难度就直接照搬 。 实际上, 虽然大多数编程语言 都默认数组从0开始 , 但还是有不少例外的 , 例如 python 就支持负数下标 (但数组下标仍然默认从0开始记数 , 举这个例子是为了说明虽然Python从功能上可以支持默认从负数下标开始 , 但为了减少学习难度 还是从0开始) , MATLAB 就是从1开始计数 。
Share
这周看到 管理“深度系统”微服务:与Ben Sigelman的问答 。
InfoQ最近与LightStep首席执行官,OpenTracing和OpenTelemetry项目的创始人Ben Sigelman进行了交谈,讨论了在深层系统中管理微服务的挑战,在深层系统中,单个服务所有者与他们不拥有的大量服务依赖项进行交互。问题出在控制与责任之间的差异,以及团队可以准确确定每种服务内部和之间发生的事情的方式。服务彼此调用时 , 沟通链不断加深,使团队快速诊断特定位置发生错误或速度变慢的能力变得复杂 ,然后 Sigelman 针对这个主题讲了不少自己的看法。我觉得有帮助 , 分享出来 。