gvfs

学习linux第二十五天

北城余情 提交于 2021-01-03 09:22:03
管道符 把前面命令的结果输出给后面执行 [root @hanlin lvm]# cat 1.txt 22222\33333 22222;\33333 222333444444 [root @hanlin lvm]# cat 1.txt |grep '3' (把cat 1.txt的结果中的包含3 的内容过滤出来输出) 22222\33333 22222;\33333 222333444444 [root @hanlin lvm]# ls |wc -l (列出目录,数一数多少个文件) 6 作业控制 fg (foreground前台)bg(background后台) [root @hanlin lvm]# top [root @hanlin lvm]# vim 1.txt [root@hanlin lvm]# vmstat 1(列出临时停止的任务) [1]+ 已停止 vmstat 1 [2]- 已停止 vim 1.txt root@hanlin lvm]# touch 2.txt [root@hanlin lvm]# fg 1 (调用临时停止的任务1) vmstat 1 1 0 10476 293168 244 1168020 0 0 0 11 7687 6057 0 0 100 0 0 0 0 10476 292716 248 1168020 0 0 0 9 355 225 0 1

如何提高强化学习效果?内在奖励和辅助任务

随声附和 提交于 2020-09-27 16:53:24
     文字整理:智源社区 吴继芳   如何能够提高强化学习效果?   这是美国密西根大学教授Satinder Singh长期以来致力于解决的问题。在2020北京智源大会上,Satinder Singh教授对这个问题进行了深度阐释,他通过Meta-Gradient方法来学习发现以往强化学习智能体中需要手动设置的参数:内在奖励和辅助任务问题。   Satinder Singh从近期关于强化学习的两个研究工作出发,针对如何通过数据驱动的方式学习到内在奖励函数,他提出了一个学习跨多生命周期(Lifetime)内部奖励函数的Meta-Gradient框架,同时设计了相关实验证明学习到的内在奖励函数能够捕获有用的规律,这些规律有助于强化学习过程中的Exploration和Exploitation,并且可以迁移到到不同的学习智能体和环境中。   针对于如何在数据中发现问题作为辅助任务,他扩展通用辅助任务架构,参数化表示General Value Functions,并通过Meta-Gradient方法学习更新参数发现问题。实验证明这个方法可以快速发现问题来提高强化学习效果。   Satinder Singh,美国密西根大学教授,Deep Mind科学家,AAAI Fellow。主要研究兴趣是人工智能(AI)的传统目标,即构建能够学习在复杂、动态和不确定环境中具有广泛能力的自主智能体

Pycharm安装并配置jupyter notebook的实现

匆匆过客 提交于 2020-08-11 10:10:01
一: 安装命令jupyter: pip install jupyter 如果缺少依赖,缺啥装啥 二: 运行 jupyter notebook 首先,查看一下自己是否已经安装成功,在终端输入: jupyter notebook 如果运行成功,结果如下: [I 09:03:15.177 NotebookApp] JupyterLab beta preview extension loaded from /home/winddy/anaconda3/lib/python3.6/site-packages/jupyterlab [I 09:03:15.177 NotebookApp] JupyterLab application directory is /home/winddy/anaconda3/share/jupyter/lab [I 09:03:15.182 NotebookApp] Serving notebooks from local directory: /home/winddy [I 09:03:15.182 NotebookApp] 0 active kernels [I 09:03:15.182 NotebookApp] The Jupyter Notebook is running at: [I 09:03:15.182 NotebookApp] http:/