quora

[zt]Quora的用到的一些技术

我怕爱的太早我们不能终老 提交于 2020-02-21 08:36:23
很多团队都在学习、研究 Quora 。前段时间看到这篇 Quora's Technology Examined ,阐述了 Quora 的技术架构,有一些值得关注的信息,记录并分享一下。 使用云计算服务 Quora 大量使用 Amazon EC2 与 S3 服务;操作系统部署的是 Ubuntu Linux,易于部署和管理;静态内容用 Cloudfront.服务分发,图片先传到 EC2 服务器,使用 Pyhon S3 API 处理后后传到 S3。 从开始就使用云计算服务的的好处是节省了大量人工维护硬件服务器的成本,当然这个做法在咱这片土地上不太可行。 Web 层与 CMS HAProxy 作为前端负载均衡服务器,反向代理服务器是 Nginx,Nginx 后面则是 Pylons ( Pylons + Paste ) , 承担动态 Web 请求。 Webnode2 与 LiveNode 这两个内部系统承担创建、管理内容的重任,Webnode2 生成 HTML、CSS 与 JavaScript ,并且与 LiveNode 轻度耦合。LiveNode 的作用用以显示 Web 页面内容。用 Python、C++ 与 JavaScript 写的。特别提到用到了 jQuery 与 Cython。LiveNode 有可能开源。 为什么用 Python? 前面已经提到了一些 Python 相关的技术组件

Unable to login to Quora using Selenium webdriver in Python

六月ゝ 毕业季﹏ 提交于 2020-02-20 13:24:27
问题 I am using a Selenium module in Python to log into Quora. It works fine for Facebook, but I am getting an error on the send_keys('my_email') line while trying it on Quora: I am using the following script. from selenium import webdriver from selenium.webdriver.common.keys import Keys import time driver = webdriver.Firefox() driver.get('http://www.quora.com/') time.sleep(60) username = driver.find_element_by_name('email') time.sleep(60) username.send_keys('my_email') time.sleep(60) password =

Quora 用了哪些技术 ?(zz)

纵然是瞬间 提交于 2020-02-18 07:16:42
很多团队都在学习、研究 Quora 。前段时间看到这篇 Quora's Technology Examined ,阐述了 Quora 的技术架构,有一些值得关注的信息,记录并分享一下。 使用云计算服务 Quora 大量使用 Amazon EC2 与 S3 服务;操作系统部署的是 Ubuntu Linux,易于部署和管理;静态内容用 Cloudfront.服务分发,图片先传到 EC2 服务器,使用 Pyhon S3 API 处理后后传到 S3。 从开始就使用云计算服务的的好处是节省了大量人工维护硬件服务器的成本,当然这个做法在咱这片土地上不太可行。 (refer: Copyright ) Web 层与 CMS HAProxy 作为前端负载均衡服务器,反向代理服务器是 Nginx,Nginx 后面则是 Pylons ( Pylons + Paste ) , 承担动态 Web 请求。 Webnode2 与 LiveNode 这两个内部系统承担创建、管理内容的重任,Webnode2 生成 HTML、CSS 与 JavaScript ,并且与 LiveNode 轻度耦合。LiveNode 的作用用以显示 Web 页面内容。用 Python、C++ 与 JavaScript 写的。特别提到用到了 jQuery 与 Cython。LiveNode 有可能开源。 为什么用 Python?

Quora使用到的技术

守給你的承諾、 提交于 2020-02-16 05:55:19
本文主要参考了 Phil Whelan 的这篇文章《 Quora’s Technology Examined 》。关于Quora是个什么网站我就不多说了,国内对他的C2C网站叫“知乎”。呵呵。我们还是来看看Quora的技术吧。 Search-Box Quora只能搜索问题,主题标签,用户名,和主题标题。没有全文搜索,所以,你无法搜索问题和答案的内容。而搜索中使用前缀搜索方式,比如你 输入mi,则Microsoft会马上出来。其搜索还会有一些非常简单的模糊匹配的算法。另外,如果有重复的问题,其中一个问题会自动跳转到另一个问题, 但是在搜索中还是会出现。搜索中没有拼写检查。 一开始,他们使用的是一个开源的搜索服务器,叫 Sphinx 。其支持上述的那些功能。现在他们不用这个技术了,因为 受到了一些限制 。他们做了一个比较新的解决方案,这个算法由Python实现。 参看 : What libraries does Quora use for search? 实时查询 Quora的查询是非常高速的,其查询请求是通过AJAX的GET请求发送的,结果返回用的是JSON数据格式,但他们解析JSON是在服务器 端,而不是通过浏览器的JavaScript。这么做的原因可能是他们想高亮搜索关键词,似乎使用Client端的JavaScript非常不好做。 Quora的即时搜索好像比较暴力

Use all of the requests to answer available at once on a question on Quora from the Google Chrome browser console

别等时光非礼了梦想. 提交于 2020-01-23 03:18:45
问题 I often have to click 25 times on the blue button with a plus next to the suggested profiles that might answer the question I'm interested in on Quora. It's boring. What should I put in the google chrome console to automate this process? 回答1: After you open the modal where you can request answers from other Quora users enter this in the browser console: document.querySelectorAll(`a[aria-label='Request']`).forEach(el =>{el.click()}) you don't even need to open the console if you add this as

How can I add quora follow button on my webpage

别来无恙 提交于 2019-12-24 11:36:25
问题 I am trying to add quora follow button on my web page I searched for it and got some old links that are not working now. I think quora have removed those options now. Is there some way to do that 回答1: Seems like, the following relation, loads up Quora follow icon, needs to be included inside head. <link rel="icon" href="https://qsf.fs.quoracdn.net/-3-images.favicon.ico-26- 3f34badcb59c8f6c.ico"> And for button addition inside body, just create a button of a relevant size and add a hyperlink.

Scrape dynamic loading pages with phantomjs

我与影子孤独终老i 提交于 2019-12-13 18:59:27
问题 I am trying to scrape a quora log page like this Quora question log to get to the bottom of page and get the name of person who added the question. i am using this code for phantomjs var page = require('webpage').create(); var fs = require('fs'); var output = './temp_htmls/test1.html'; page.open('url', function() { fs.write(output,page.content,'w'); phantom.exit(); }); But this only fetches a single web page and cannot fetch complete webpage until end. Can someone point what i am missing with

Quora是如何做推荐的?

我怕爱的太早我们不能终老 提交于 2019-12-12 05:58:34
知乎联合创始人张亮在值乎上问了俞军老师一个问题,「以您的使用体验看,您觉得知乎现在最急需做的三到五项产品改进是哪些?」俞军老师的回答中给的第一个意见就是,「个性化内容的挖掘和推送,我知道知乎里有大量内容是我感兴趣的,但知乎推送的内容只有很少是我愿意点击的,总让我有种入宝山而空回的感觉,这方面网易云音乐、淘宝、今日头条都是不错的学习对象。」那么,有着“美版知乎”之称的Quora是如何做推荐的呢?以下内容选自RecsysChina。 Quora的VP Engineering机器学习大牛Xavier Amatriain,曾在WWW2016大会的Question Answering Workshop做了一个报告, Machine Learning for Q&A Sites: The Quora Example [1]。 Quora的Mission: To share and grow the world's knowledge 。 Quora主要考虑的三个因素:Relevance、Quality和Demand。 Quora核心的数据模型及其之间的关系: Feed Ranking Quora做推荐的一个最核心问题就是Personalized Feed Ranking。Quora是以问题、答案与主题为核心把「知识」串联起来,然后基于用户的顶和踩等动作来划分内容质量

Trying to login to quora using mechanize

做~自己de王妃 提交于 2019-12-11 01:57:16
问题 I'm trying to use mechanize module to login to quora.com. This is my code: #!/usr/bin/env python import mechanize import cookielib br = mechanize.Browser() # create a browser object br.set_handle_equiv(True) br.set_handle_redirect(True) br.set_handle_referer(True) br.set_handle_robots(False) br.set_headers = [('User-Agent', 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)')] cj = cookielib.LWPCookieJar() br.set_cookiejar(cj) res = br.open('http://www.quora.com') br

Unable to login to Quora using Selenium webdriver in Python

时光毁灭记忆、已成空白 提交于 2019-12-04 13:49:44
I am using a Selenium module in Python to log into Quora. It works fine for Facebook, but I am getting an error on the send_keys('my_email') line while trying it on Quora: I am using the following script. from selenium import webdriver from selenium.webdriver.common.keys import Keys import time driver = webdriver.Firefox() driver.get('http://www.quora.com/') time.sleep(60) username = driver.find_element_by_name('email') time.sleep(60) username.send_keys('my_email') time.sleep(60) password = driver.find_element_by_name('password') time.sleep(60) password.send_keys('my_password') time.sleep(60)