Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo

1

SOSO 访问速度优化 Calvinli 2007-12-04

2

SOSO 产品线简单介绍

3

综合搜索

4

问问

5

看看我们都优化了哪些部分 服务器布局优化 减少页面 HTTP 请求 启用服务器端压缩 调整 DNS TTL CDN 外包 第三方评测服务 … …

6

服务器布局优化 SOSO 用户分布 通过对用户来源的统计分析, soso 用户主要分布在南方沿海省份及人口大省,南北方分布比例大致为 7 : 3 ,其中广东超过 200 万独立用户,江苏、浙江分别超过 100 万独立用户。

7

服务器布局优化 SOSO 理想服务器布局

8

服务器布局优化 按照用户的运营商及地域分布, SOSO 用户大致可以分为五个区域:

9

服务器布局优化

10

服务器布局优化 根据用户数据分析及公司对 IDC 的建设重点, SOSO 最终部署的 IDC 为: 天津 北京 (北方用户) 西安 (西南、西北用户) 深圳 (南方用户) 上海 南京 (华东、华南用户)

11

服务器布局优化 案例 一 www.soso.com 网页搜索频道 网页搜索之前仅在天津和深圳部署服务器,调整后网页搜索前台分布在北京、上海、深圳、成都。 这样的分布照顾了各地用户的体验,尤其可以改善北京、上海、江浙一带、四川等地的用户,这些地区用户数超过 SOSO 用户的 30% 。 网页前台从天津迁移至北京后,北京用户访问速度提升 29% , 增加上海服务器部署后,上海用户访问速度提升 25% , 增加成都服务器部署后,四川用户访问速度提升 27% 。

12

最大限度的减少 HTTP 请求 用户装载页面过程中 85% 以上的时间花费在装载图像、 CSS 、 JS 等,而浏览器在同一个域名下默认只支持两个并发请求,所以最大限度的减少 HTTP 请求是网页快速装载的关键。

13

最大限度的减少 HTTP 请求 在不影响产品表现的情况下尽量精简页面元素 使用 CSS 图像拼合技术 将原有页面中由 JS 实现的部分功能迁移到后台实现,页面中只保留必要的 JS 页面大小尽量在控制在 MTU 的整数倍,充分利用每一次包传输

14

最大限度的减少 HTTP 请求 案例 二 SOSO 音乐搜索首页应用了 css 图像拼合技术,将页面中用到的小图片拼合成一张大图片在 css 中调用 图像拼合前需要 7 次 http 请求才可以将图片下载完,拼合后只需要 1 次 图像拼合后减少了页面代码中的重复部分

15

最大限度的减少 HTTP 请求

16

启用服务器端压缩 针对 apache 1.3 + mod_gzip 和 apache-2.0.59 + mod_deflate 等多种配置进行响应时间、压缩率、服务器负载的测试。 测试结果表明在压缩率基本相同的情况下,由于 mod_deflate ( C )模块造成的负载远低于 mod_gzip ( A ) ,  最终选定 apache2.0.59+mod_deflate

17

启用服务器端压缩 案例三 Apache 打开 mod_deflate 后流量较之前节省了 30-40%. 以 12 月 22 日和 12 月 19 日流量数据对比,打开 mod_deflate 后流量较之前节省了约 35%.

18

调整 DNS TTL DNS TTL 通过对用户访问过程的监测,发现在用户访问过程中, DNS 解析时间占用了较大的比例,通过与管工的沟通,将 DNS TTL 由 10 分钟修改为 30 分钟。 延长 DNS TTL 时间可以减少用户到根服务器解析 A 纪录的次数,从而减少 DNS 解析时间,同时也降低了用户到 DNS 访问出错的几率,提高服务可用性。 TTL 修改后每天的根域查询量降低了 40% 。

19

CDN 外包 今年 4 月初,公司启动了 CDN 外包项目, SOSO 对各厂商进行测试,在对试点数据进行了多次测试和分析的基础上, 5 月底开始逐步将线上内容切换至 CDN ,虽然 CDN 的推进带来了一些额外的工作,但是静态内容切换至 CDN 后, 速度较切换前提升 15% ,同时节省了大量服务器和运营管理的成本。

20

第三方评测服务 为了客观得到用户访问的体验数据,我们在部门自己架设监测服务器的基础上,引入了第三方评测服务, 5 月初购买了 gomez 评测服务,通过 gomez 在全国的节点对现有服务进行监测,可以知道不同地区、不同接入带宽的最终用户实际访问效果,对业务的改进很有帮助。

21

第三方评测服务 Gomez 测试数据展示。 可以通过最终用户的访问纪录到用户请求每一个页面元素的 DNS 、 Connect 、 1stByte 、 Download 等时间 还可以看到按省份、运营商等分类的统计数据。

22

优化成果 2007 年 14 期《 互联网周刊》刊登了一篇名为《中国热门网站用户体验排行榜》的文章,文中 SOSO  在响应时间、可靠性、稳定性三个方面分列第三、第二和第三;在国内搜索类网站中排名第二。 这个排行榜是《互联网周刊》与网络服务机构 gomez 共同推出的, 5 月底,测试方根据中国互联网协会( http:// www.chinarank.org.cn / )上热门网站的排行,通过部署在北京、上海、广州的测试节点对热门网站进行了为期一个月的监测。

23

后续的性能优化相关工作 利用 toolbar 客户端优势,搭建产品测速平台。 网页搜索结果页静态化。

24

谢谢大家

More Related Content

腾讯大讲堂13 soso访问速度优化

  • 5. 看看我们都优化了哪些部分 服务器布局优化 减少页面 HTTP 请求 启用服务器端压缩 调整 DNS TTL CDN 外包 第三方评测服务 … …
  • 6. 服务器布局优化 SOSO 用户分布 通过对用户来源的统计分析, soso 用户主要分布在南方沿海省份及人口大省,南北方分布比例大致为 7 : 3 ,其中广东超过 200 万独立用户,江苏、浙江分别超过 100 万独立用户。
  • 10. 服务器布局优化 根据用户数据分析及公司对 IDC 的建设重点, SOSO 最终部署的 IDC 为: 天津 北京 (北方用户) 西安 (西南、西北用户) 深圳 (南方用户) 上海 南京 (华东、华南用户)
  • 11. 服务器布局优化 案例 一 www.soso.com 网页搜索频道 网页搜索之前仅在天津和深圳部署服务器,调整后网页搜索前台分布在北京、上海、深圳、成都。 这样的分布照顾了各地用户的体验,尤其可以改善北京、上海、江浙一带、四川等地的用户,这些地区用户数超过 SOSO 用户的 30% 。 网页前台从天津迁移至北京后,北京用户访问速度提升 29% , 增加上海服务器部署后,上海用户访问速度提升 25% , 增加成都服务器部署后,四川用户访问速度提升 27% 。
  • 12. 最大限度的减少 HTTP 请求 用户装载页面过程中 85% 以上的时间花费在装载图像、 CSS 、 JS 等,而浏览器在同一个域名下默认只支持两个并发请求,所以最大限度的减少 HTTP 请求是网页快速装载的关键。
  • 13. 最大限度的减少 HTTP 请求 在不影响产品表现的情况下尽量精简页面元素 使用 CSS 图像拼合技术 将原有页面中由 JS 实现的部分功能迁移到后台实现,页面中只保留必要的 JS 页面大小尽量在控制在 MTU 的整数倍,充分利用每一次包传输
  • 14. 最大限度的减少 HTTP 请求 案例 二 SOSO 音乐搜索首页应用了 css 图像拼合技术,将页面中用到的小图片拼合成一张大图片在 css 中调用 图像拼合前需要 7 次 http 请求才可以将图片下载完,拼合后只需要 1 次 图像拼合后减少了页面代码中的重复部分
  • 16. 启用服务器端压缩 针对 apache 1.3 + mod_gzip 和 apache-2.0.59 + mod_deflate 等多种配置进行响应时间、压缩率、服务器负载的测试。 测试结果表明在压缩率基本相同的情况下,由于 mod_deflate ( C )模块造成的负载远低于 mod_gzip ( A ) , 最终选定 apache2.0.59+mod_deflate
  • 17. 启用服务器端压缩 案例三 Apache 打开 mod_deflate 后流量较之前节省了 30-40%. 以 12 月 22 日和 12 月 19 日流量数据对比,打开 mod_deflate 后流量较之前节省了约 35%.
  • 18. 调整 DNS TTL DNS TTL 通过对用户访问过程的监测,发现在用户访问过程中, DNS 解析时间占用了较大的比例,通过与管工的沟通,将 DNS TTL 由 10 分钟修改为 30 分钟。 延长 DNS TTL 时间可以减少用户到根服务器解析 A 纪录的次数,从而减少 DNS 解析时间,同时也降低了用户到 DNS 访问出错的几率,提高服务可用性。 TTL 修改后每天的根域查询量降低了 40% 。
  • 19. CDN 外包 今年 4 月初,公司启动了 CDN 外包项目, SOSO 对各厂商进行测试,在对试点数据进行了多次测试和分析的基础上, 5 月底开始逐步将线上内容切换至 CDN ,虽然 CDN 的推进带来了一些额外的工作,但是静态内容切换至 CDN 后, 速度较切换前提升 15% ,同时节省了大量服务器和运营管理的成本。
  • 20. 第三方评测服务 为了客观得到用户访问的体验数据,我们在部门自己架设监测服务器的基础上,引入了第三方评测服务, 5 月初购买了 gomez 评测服务,通过 gomez 在全国的节点对现有服务进行监测,可以知道不同地区、不同接入带宽的最终用户实际访问效果,对业务的改进很有帮助。
  • 21. 第三方评测服务 Gomez 测试数据展示。 可以通过最终用户的访问纪录到用户请求每一个页面元素的 DNS 、 Connect 、 1stByte 、 Download 等时间 还可以看到按省份、运营商等分类的统计数据。
  • 22. 优化成果 2007 年 14 期《 互联网周刊》刊登了一篇名为《中国热门网站用户体验排行榜》的文章,文中 SOSO 在响应时间、可靠性、稳定性三个方面分列第三、第二和第三;在国内搜索类网站中排名第二。 这个排行榜是《互联网周刊》与网络服务机构 gomez 共同推出的, 5 月底,测试方根据中国互联网协会( http:// www.chinarank.org.cn / )上热门网站的排行,通过部署在北京、上海、广州的测试节点对热门网站进行了为期一个月的监测。
  • 23. 后续的性能优化相关工作 利用 toolbar 客户端优势,搭建产品测速平台。 网页搜索结果页静态化。

Editor's Notes

  1. SOSO 从开始运营起,速度性能优化工作一直在持续不断的进行,看看我们都做了哪些工作。
  2. 按照用户分布,按理想状态做服务器的布属,在独立用户超过 50 万的地区部署服务器。右图为 chinacache 在全国的服务器分布,目前 chinacache 在国内拥有 350 个节点,可服务的互联网用户超过全国总数的 95% 。( 2006 年全国上网人数为 1.23 亿)
  3. 由于运营成本等诸多问题,我们不可能按照理想分布部署服务器,所以我们按照用户的分布,把全国分为四个区域,既北方用户(指北方十省)、华东华南用户(主要指江浙、福建等东南沿海省份)、南方用户(指广东等南方省份)、西北西南用户(主要指西部省份)。其他用户约占全部用户的 10.16% 。 * 其他用户为教育网、铁通、移动、联通或未知地域、运营商的用户。
  4. 全国的四个区域,这个区域的划分参考了 SOSO 的用户分布以及公司的 IDC 测速平台对现有 IDC 的速度测试数据。
  5. 上述全国四个区域的划分正好符合了公司对全国 IDC 的建设重点,既北方用户(天津、北京)、西南、西北用户(西安)、南方用户(深圳)、华东、华南用户(南京、上海)
  6. A : apache 1.3 + mod_gzip C : apache-2.0.59 + mod_deflate D : apache-2.0.59 + mod_defalte + mod_file_cache Aapche 2.0.59 中开启 mod_file_cache 后,对访问成功率、总消耗时间、服务器端负载均稍有改善,但改善幅度很小。同时,由于目前标准 mod_file_cache 配置是通过配置文件中的文件列表完成,不够灵活,如果启用,会增加内容发布更新的难度,所以未选用。
  7. 国内没有 DNS 根服务器,所有根域的查询要到国外的根服务器进行,增加了出错的几率及解析时间。浏览器在域名解析完成前无法下载任何内容。