百度文库

仿百度文库

依然范特西╮ 提交于 2020-01-01 22:08:17
百度文库现已经做得很大,得到大家的模仿和探索。 我也研究了一阵子:) 1. 用户上传 文档 2. 百度审核,在审核同时,转换文档,将上传的文档转换为百度固有格式的swf文件 3. 截取swf第一帧作为封面 用户通过百度的reader.swf浏览文档。 有几个地方不是很明白。 1. 百度转换后的swf文件,只有百度的reader.swf才能装载,有没有通用的reader? 2. 百度如何转换文档,是通过flashpaper 还是SWFTools 3. 百度是否首先统一转换为pdf,再由pdf-》swf 来源: https://www.cnblogs.com/flysent/archive/2010/06/22/1762451.html

仿百度文库解决方案

梦想的初衷 提交于 2020-01-01 22:07:44
接公司需求,要实现类似百度文库的这么一个东西 关键的技术就在于文档转换为swf,及展示 网上搜了好多参考,总结出几种可实现方案: 1.Print2flash商业软件。功能非常强大,可制定性强,稳定。可直接把office、PDF等文档直接转换成带浏览框架的swf文件。唯一缺点是,收费,搜不到破解方法,有序列号,但序列号版本功能有限制,不适合通过代码实现文档转换 2.FlashPaper。同上,可以直接把office、PDF等文档直接转换成带浏览框架的swf文件。只是无法制定皮肤、水印等东西,速度慢,不稳定。 3.最后决定使用的方案是:office文档转换为PDF,再通过pdf转为swf,使用flex制作一个浏览框架swf文件。 所需环境为: 1.adobe acrobat 9。转换为pdf文件 2.office2007。将office文件转为pdf时,除了acrobat,当然office功能不可少。 3.swftools。开源工具,可将pdf文件转为SWF文件 4.vs2010开发环境,通过.net开发一个命令小工具,调用acrobat库的功能,实现命令行方式转换office,代码其实也就十来行就实现了。 实现步骤: 1.安装adobe acrobat 9、office2007、swftools等软件 2.使用vs2010开发命令行工具,调用acrobat的PDFMakerAPI

仿百度文库方案[openoffice.org 3+swftools+flexpaper](四) 之 使用swftools将pdf转换为swf

旧巷老猫 提交于 2020-01-01 21:55:58
第四步,使用swftools将pdf转换为swf 建议下载swftools-0.9.1,笔者起先下载的是最新版的swftools-1.0版。貌似转换时出错,缺少什么组件。 继续笔者的DocConverter项目。笔者使用的开发环境是MyEclipse 9.0。 新建PDF2SWFUtil.java package com.iori.webapp.util;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;public class PDF2SWFUtil { /** * 利用SWFTools工具将pdf转换成swf,转换完后的swf文件与pdf同名 * @author iori * @param fileDir PDF文件存放路径(包括文件名) * @param exePath 转换器安装路径 * @throws IOException */ public static synchronized void pdf2swf(String fileDir, String exePath) throws IOException { //文件路径 String filePath = fileDir

利用FlexPaper显示Flash(SWF)

北城以北 提交于 2020-01-01 21:55:06
目录 仿百度文库解决方案(一)—— 总体思路 仿百度文库解决方案(二)—— 利用Jacob调用MS Office转换文档为PDF 仿百度文库解决方案(三)—— 利用JCom调用MS Office或者Acrobat API转换文档为PDF 仿百度文库解决方案(四)—— 利用JODConverter调用OpenOffice.org服务转换文档为PDF 仿百度文库解决方案(五)—— 利用SWFTools转换PDF文档为SWF 仿百度文库解决方案(六)—— 利用FlexPaper显示Flash(SWF) 1. FlexPaper简介   FlexPaper是一个开源轻量级的文档浏览组件,被设计和比如PDF2SWF库(包含于SWFTools)一起工作,使得在网页上,Adobe Flex以及别的基于Flash的应用程序中显示和交互PDF文件成为可能。即,使得在没有安装PDF阅读器软件的情况下浏览PDF文件成为可能。FlexPaper项目同时提供了Flex库和独立的Flash版本。 2. 使用FlexPaper  2.1 下载FlexPaper   FlexPaper在google code上的项目地址为 http://code.google.com/p/flexpaper/ 。目前,FlexPaper最新的flash版本为 FlexPaper_1.5.1_flash.zip 。 下载、解压后

类似百度文库在线预览文档flash版(支持word、excel、ppt、pdf)+在线预览文档html版

|▌冷眼眸甩不掉的悲伤 提交于 2019-12-18 09:26:19
1.首先上网搜索一下有什么解决方案 (1).将文档转换为html,只支持支持office文档 (2).将文档转换为flash,实现类似百度文库的效果,除支持office文档外还支持pdf   (1) a.首先添加引用: using Microsoft.Office.Core;using Word = Microsoft.Office.Interop.Word; 复制代码   b.其次编写文档转换的方法: 1 /// <summary> 2 /// word转成html 3 /// </summary> 4 /// <param name="path">要转换的文档的路径</param> 5 /// <param name="savePath">转换成的html的保存路径</param> 6 /// <param name="wordFileName">转换后html文件的名字</param> 7 private static void WordToHtml(string path, string savePath, string wordFileName) 8 { 9 Word.ApplicationClass word = new Word.ApplicationClass();10 Type wordType = word.GetType();11 Word.Documents

16套爬虫实战源码

走远了吗. 提交于 2019-12-14 07:06:20
github地址:https://github.com/Jack-Cherish/python-spider#%E5%85%B6%E5%AE%83 因为一些众所周知的原因,github的下载速度慢的让人抓狂(几k/s的速度还能下载失败,,,),所以我为了方便大家已经下载打包整理好了,有需要的同学欢迎评论区留言。 笔趣看小说下载 biqukan.py:《笔趣看》盗版小说网站,爬取小说工具 百度文库免费文章下载助手_rev1 baiduwenku.py: 百度文库word文章爬取 百度文库免费文章下载助手_rev2 baiduwenku.py: 百度文库word文章爬取 《帅啊》网帅哥图片下载 shuaia.py: 爬取《帅啊》网,帅哥图片 构建代理IP池 daili.py: 构建代理IP池 《火影忍者》漫画下载 carton: 使用Scrapy爬取《火影忍者》漫画 代码可以爬取整个《火影忍者》漫画所有章节的内容,保存到本地。更改地址,可以爬取其他漫画。保存地址可以在settings.py中修改。 财务报表下载小助手 financical.py: 财务报表下载小助手 爬取的数据存入数据库会吗?《跟股神巴菲特学习炒股之财务报表入库(MySQL)》也许能给你一些思路。 一小时入门网络爬虫 one_hour_spider:一小时入门Python3网络爬虫。 本次实战内容有: 网络小说下载

vue.js 查看百度文库文档

邮差的信 提交于 2019-12-10 17:54:11
<template> <div> <div id="reader"></div> </div></template> <script>  //doc.js文件地址 http://static.bcedocument.com/reader/v2/doc_reader_v2.js import doc from '../../libs/doc'; export default { data(){      return{        loading:false      }           }, created() { this.getInfo(this.$route.query.id); }, methods:{ getInfo(id){ this.loading = true; this.$api.recommend.show(id).then(result =>{ if(result.success){ let textId =result.result.content.id;                 //获取到文档id 请求接口获取docId,host,token三个变量                               this.$api.recommend.getDoc(textId).then(res =>{ // console.log(res)

百度文库可复制文字的方法

与世无争的帅哥 提交于 2019-12-05 02:19:40
第一步,找到需要下载文库的id, https://wenku.baidu.com/view/ccc83f4eac51f01dc281e53a580216fc710a5314.html?from=search 中 ccc83f4eac51f01dc281e53a580216fc710a5314 这个就是这篇文章的id. 第二部,替换id到新链接, https://wk.baidu.com/view/ccc83f4eac51f01dc281e53a580216fc710a5314 只需要替换id就可以,这个是百度文库的wap版,这个版本并没有生成图片,网页版生成图片了。 第三步,将这个页面另存为到本地电脑 第四步,搜索找出页面中的一段代码 ,style="user-select: none; 将这行样式删除,在本地打开这个页面,开始复制吧。 注意:wap页面需要将整个页面都预览完成,否则有些文字部分仍是加载不出来,另外到本地电脑显示不全。 来源: https://www.cnblogs.com/shej123/p/11897366.html

百度文档,用Python一键免费下载

﹥>﹥吖頭↗ 提交于 2019-12-04 03:44:47
百度文库下载需要券,或者vip才能下载 Vip价格高,偶尔下载一次不划算。 不下载复制?不好意思复制也需要vip否则只能一次复制两行。 如何才能以最低成本获取到百度文库里的文档内容呢? 当然是用Python啦! 接下来教大家如何使用Python免费下载百度文档。 由于百度文库的内容是通过网页展示的,那我们猜他是通过后台加载进来的。可以先通过Ctrl+u查看HTML源码,看源码里面是否有文档数据。很遗憾HTML源码里面并没有文档内容。 确定不是通过HTML加载的之后,我们就可以大胆的猜测他是通过json异步加载。所以通过F12打开开发者管理工具network抓包,查看页面加载过程请求的URL。这里会有大量的请求,但是我们仔细观察会发现有一个0.json的URL返回的数据就是文档的文本数据。 拿到请求文档数据的URL后需要确定URL参数。通过查看headers确定请求方式为GET请求。请求参数里x-bce-range和token是变动的,其他都是固定不变。 token这个东西很多时候都会写入到HTML页面里去,用途是防csrf攻击。但是百度文档里面的token有什么用我们不用关心,重要的是这个token那里来。去HTML源代码里查看这两个变量能不能获取到。 果然,在HTML源码里有一段js代码,其中就包含了所有请求文档的URL。看起来有点像,但还是不一样啊!其实这里是包含了转移符 \