Archive Web » <? bloginfo('name'); ?>

Web

discuz禁止某个版帖子的收录

各种原因，需要禁止SE对discuz某个版面帖子的收录(如水版、或为了更好的SEO等)。当然如果设置了权限，不允许游浏览此版面，那么就肯定不能收录了。

1.使用robots.txt文件，禁止版块列表的收录

 
Disallow: /forum-1-

#数字即为要禁止版块的ID。

#注意数字最后的 – 不要省略，否则连ID为11，12等1开头的版都禁了

2.加meta robots标签，禁止收录某个版块帖子

修改viewthread.php文件，在$oldtopics = isset($_DCOOKIE[‘oldtopics’]) ? $_DCOOKIE[‘oldtopics’] : ‘D’; 上面加：

 
if( $thread['fid']==1 ){
$seohead .= '<meta name="robots" content="noindex,nofollow" />';
}

判断一下帖子是属于哪个版($thread[‘fid’])的,给它加上meta robots禁止。

第一点虽然禁止版块收录了，但有可能从动态形式或其它地方访问到帖子链接，所以还要用第二点给帖子页加上meta。这两点中的版块ID和要您禁止的版块对应，如果有多个版块，第一点中添加行就行了，第二点要修改断语句中中的逻辑表达式。

Tags: discuz, seo

星期五, 12 3 月, 2010 Web 没有评论

discuz会产生哪些无效的页面，有什么问题

1.删除了的帖子、版块，当访问时返回帖子不存在的提示信息页。

2.设置了一定权限才能浏览的帖子、版块，很多情况会泄露链接，得到没权限的提示

3.其它各种情况下的提示信息页面。这些都是给用户看的，没有实质内容，都禁止收录。

其实最大的问题还是副本内容的问题，因这些不同的URL，返回的却是相同的内容。对SE不友好。其实对于删除了内容，应该返回404,但为了简单，都使用加meta robots标签，禁止ES收录的方法来解决。

修改提示信息页面，解决重复内容问题

方法一

1.建立/templates/defualt/header_norobot.htm文件

完全拷贝header.htm的内容，在<title>下再加一行：

2.修改/templates/default/showmessage.htm文件

将{subtemplate header}替换为{subtemplate header_norobot}

3.修改/templates/default/nopermission.htm文件

将{subtemplate header}替换为{subtemplate header_norobot}

如此修改之后，SE就不会收录无权访问的URL，对于已删除的帖子，因为禁止收录了，过一段时间也会从索引中删除。这样，给SE的都是一些有内容的网页，对于提高权重会有好处。

方法二

修改global.func.php文件中的showmessage函数。

function showmessage($message, $url_forward = '', $extra = '', $forwardtype = 0) {
extract($GLOBALS, EXTR_SKIP);
global $hookscriptmessage, $extrahead, $discuz_uid, $discuz_action, $debuginfo, $seccode, $seccodestatus, $fid, $tid, $charset, $show_message, $inajax, $_DCACHE, $advlist;
define('CACHE_FORBIDDEN', TRUE);
$hookscriptmessage = $show_message = $message;$messagehandle = 0;

在第四行 define(‘CACHE_FORBIDDEN’, TRUE); 后面加上：

$extrahead .='';

即是

function showmessage($message, $url_forward = '', $extra = '', $forwardtype = 0) {
extract($GLOBALS, EXTR_SKIP);
global $hookscriptmessage, $extrahead, $discuz_uid, $discuz_action, $debuginfo, $seccode, $seccodestatus, $fid, $tid, $charset, $show_message, $inajax, $_DCACHE, $advlist;
define('CACHE_FORBIDDEN', TRUE);
$extrahead .='<meta name="robots" content="noindex,nofollow" />';
$hookscriptmessage = $show_message = $message;$messagehandle = 0;

Tags: discuz, php, seo

星期五, 12 3 月, 2010 Web 没有评论

discuz论坛的robots.txt文件设置

User-agent: *
Allow: /redirect.php
Allow: /viewthread.php
Allow: /forumdisplay.php
Disallow: /?
Disallow: /*.php

搜索引擎对robots.txt的支持情况

1. 对于allow 及 * $ 通佩符都支持，定义是一样的。
2.对于同一个User-agent 段内的 allow 和 disallow，匹配规则是不一样的。
google,baidu,sogou对于allow的优先级高，只要有allow允许，不管在段内什么位置，不管之前disallow设置如何，蜘蛛就会索引；
而live serch, yahoo对于allow和disallow的定义是平级的，按照从下到下的顺序只要匹配成功就退出。youdao未知

from:http://seo.banmutian.org/thread-2-1-1.html

Tags: discuz, robots.txt, seo

星期五, 12 3 月, 2010 Web 没有评论

各大搜索引擎网站登录入口

Google：登录您的网站
http://www.google.com/intl/zh-CN/add_url.html

百度搜索帮助中心-网站登录
http://www.baidu.com/search/url_submit.html

雅虎网址大全_网站登录
http://site.yahoo.com.cn/feedback.html

蜜蜂导航搜索-网站提交
http://www.mifeng.cc/login.asp

如何向雅虎提交我的网
http://search.help.cn.yahoo.com/h4_4.html

alexa资料提交
http://www.alexa.com/site/help/webmasters

MSN提交URL
http://search.msn.com.cn/docs/submit.aspx

SOHU（搜狐）网站登记-搜狗免费网站登录
http://db.sohu.com/regurl/regform.asp

TOM搜索 >> 网站登录
http://search.tom.com/tools/weblog/log.php

Google网页目录
http://directory.google.com/Top/World/Chinese_Simplified/

蜜蜂导航
http://www.mifeng.cc

hao123网址之家
http://post.baidu.com/f?kw=hao123

爱问搜索
http://iask.com/guest/add_url.php

中国搜索
http://ads.zhongsou.com/register/page.jsp

天网搜索
http://home.tianwang.com/denglu.htm

排名
http://top.chinaz.com

Tags: seo, 搜索引擎, 登录

星期四, 11 3 月, 2010 Web 没有评论

Syntax Highlighter WordPress Plugin

wordpress高亮插件，使用方法：在HTML编辑模式下，用
<pre class=”brush:[code-alias]”> 你的代码 </pre> 即可。
很显然，Code-alias是所使用编程语言的名称，例如对于php有：
<pre class=”brush:[php]”> php 代码 </pre>

http://www.lastengine.com/syntax-highlighter-wordpress-plugin/

Overview

This is a wordpress syntax highlighting plugin. It is simple and probably one of the best syntax highlighters in the market. This plugin integrates Alex Gorbatchev’s Syntax Highlighter Tool Full Support for :

Bash/shell
C#
C++
CSS
Delphi
Diff
Groovy
JavaScript
Java
Perl
PHP
Plain Text
Python
Ruby
Scala
SQL
Visual Basic
XML

Tags: plugin, wordpress, 高亮

星期四, 11 3 月, 2010 Web 没有评论

网站前端优化一些小经验

1. 合并脚本文件
包括脚本,样式和图片,可以有选择的把一些Js和css可以合并成一个文件,一些图片可以使用css sprites技术.这样做的原因是什么?做过web开发的人都知道,js和css基本是不变的,是静态文件,图片亦然.那么不变的文件如果适当的合并在一起,会有什么效果呢?请求的次数从多次变成了一次.这样http请求的次数就减少了.当时合并之后,文件体积变大了,会影响速度吗?答:肯定会啊,不过这里是需要权衡的,比如我100份静态文件,合并成10份还是合并成1份这就得看你得具体情况了.

2. 指定Expires或者Cache-Control,
对于静态内容：设置文件头过期时间Expires的值为“Never expire”（永不过期）
动态页面,在代码中添加cache-control,表示多少时间之后过期,如:
response.setHeader(“Cache-Control”, “max-age=3600”);
如果使用了Expires文件头，当页面内容改变时就必须改变内容的文件名。通常是在文件内容后加版本号
这一点是大多数人都忽略得,之前很多人在坛子上发布自己得小系统,还有demo,ahuaxuan跑过去一看,my god,一堆又一堆得js,css,既没有恰当得合并,也没有设置过期时间.每次刷新页面都要重新下载这一堆又一堆的js,css.http请求那叫一个多啊.无谓了流量就这样产生了.

这一点在企业应用的系统中也时有发生.比如我们使用extjs作为前端的技术,400多k啊,每打开一个页面都导入,下载这个js,够无聊的.那么童子们可能就要问了,静态文件为啥不用apache,lighttpd等呢,答,用了又怎么样,不设expire或者max-age不是一样要下载,最好的方法是写一个filter,再filter中判断,如果url满足一定的条件(比如符合配置文件中的正则表达式),那么就设置一个max-age,这样就ok,太简单了,几行代码就可以搞定.快哉.

3. 缓存Ajax请求
缓存的方法同动态页面,ajax请求需要使用get方式,url长度为2k(ie)限制(post请求有两个过程,1发送请求headers,2 发送请求数据,根据http规范,get请求只会发送一个tcp包).——–这一段话来自yahoo,先不管其真假,我们从另外一个方面来考虑一下为什么最好使用get方式,讲一个ahuaxuan经历过的事情,之前有一个项目的ajax请求使用了post方式,后来发现经常出错,而且抛出了 squid的错误,因为我们的网站使用了squid,问题就出在这里了,从http协议上可以了解到,method=post是指把数据提交到服务器上去,那么squid的一个特性是不会缓存post请求(事实上它确实不应该缓存,因为这样会违反http协议中的语义),把ajax请求改成get方式之后,一切恢复如常.

4. 移除重复的js
重复的js导入也有可能导致ie重新加载该脚本.没啥好说的,照做.

5. 避免重定向
有一种经常被网页开发者忽略却往往十分浪费响应时间的跳转现象。这种现象发生在当URL本该有斜杠（/）却被忽略掉时。这时候会返回一个301的状态码,然后浏览器重新发起一次请求.在企业应用里,重定向是我们在企业应用中常用的技术,不过用在网站项目上,您可要小心了,因为普通的重定向其实是 server在response header中设置http status=302,浏览器收到之后,判断出是302,会重新发送一个请求,目标地址是前一次返回中指定的地址.在网站项目中如果可以不用重定向就别用吧.如果您做企业应用项目,ok,关系不大,您就放心的”定”吧.

小节,ahuaxuan把减少http请求次数分为了以上5个小点,每个小点之后附加一些实例,大家可以根据这些点来判断自己的项目是否可以有优化的地方.

使用cdn
让内容更靠近用户,这有啥好说呢,原理很简单,就是根据用户浏览器所在机器的ip来判断哪些服务器离用户最近,浏览器会再次去请求这些最近的机器.一般的cdn服务商是通过开发自己的dns server来达到这个目的的.不过这个是通常情况哦,技术实力比较高,或者场景比较特殊的公司会开发自己的cdn.当然不管怎么说,使用cdn肯定可以使页面响应更快(也包括音频,视频,图片,文本文件,等等等等)

减小返回数据的体积
1. 使用gzip压缩返回数据
Gzip压缩所有可能的文件类型是减少文件体积增加用户体验的简单方法。比如本来400k的文件,压缩一下之后只有50k-100k,那么网络的流量就立刻下来了,压缩的代价是服务器端要压缩文件,需要消耗cpu,浏览器需要解压文件,也需要消耗cpu,不过对于现代这么nb的pc,来说,浏览器解压一下数据带来的cpu消耗简直不值一提.所以您就压吧.不过压的时候要小心哦,有的浏览器在特定场景下会出去一些小bug,导致页面不正常.比如 ie6在跨域的时候可能会有些小麻烦,把这部分数据的gzip去掉就可以了.

2. 最小化js文件和css文件
压缩js可以使用JSMin或者YUI Compressor,后者同时可以压缩css,这个也没啥好说的,照做吧.

3. 将css和js独立成外部文件
其实这一点也可以看成是区分不变数据和变化数据.很多人喜欢在页面商写很多很多的js和css,这些数据其实都是不会变化的数据,也就是说这些数据也是可以缓存在浏览器上的,通过把它们独立成外部文件,可以把这些数据缓存起来.这样做看上去是增加的请求的次数,但是由于第一次请求之后该部分数据已经被缓存,所以第二次就无需再请求后端,减少了网络带宽的开销.

优化Cookie
1. 减小cookie体积
能不放就别放吧,为啥呀,cookie就象钥匙串,只有出门和回家得时候才用,但是一整天你都要带在身上,麻烦不.
2. 合理设置Cookie域
由于二级域名可以拿到一级域名得cookie,那么如果,而二级域名之间确不能相互共享cookie,所以合理得设置cookie得域名也可以避免无必要得带宽浪费和响应速度得增加.
3. 设置合理的cookie过期时间
该过期就过期,不要让不必要的数据一直带在身上走来走去.
4. 使用域分离
为图片或者其他静态资源文件使用子域或者建立新的独立域名(申请新的域名),避免无必要的cookie传输,当然也是要在有必要得情况下,图片类网站肯定有必要,javaeye上得图片并没有使用域分离,所以我们得cookie其实会带到坛子得图片服务器上去,每次请求图片都是如此(不过还好,坛子里没有什么图片,所以这方面的浪费不大).

小结,其实cookie上得问题,单词请求看上去也不是什么大问题,好像是无所谓得事情,就那么几十个byte,至于吗,不过大家都听说过水滴石穿,绳锯木断的故事.所以该做的,我们还是要做,正所谓,勿以善小而不为,勿以恶小而为之.
优化浏览器加载
1. 将css放在页面顶部加载
把样式表放在文档底部的问题是在包括Internet Explorer在内的很多浏览器中这会中止内容的有序呈现。浏览器中止呈现是为了避免样式改变引起的页面元素重绘。用户不得不面对一个空白页面。
HTML规范清楚指出样式表要放包含在页面的<head />区域内：“和<a />不同，<link />只能出现在文档的<head />区域内，尽管它可以多次使用它”。无论是引起白屏还是出现没有样式化的内容都不值得去尝试。最好的方案就是按照HTML规范在文档<head />内加载你的样式表。

2. 将js放在页面底部加载
脚本带来的问题就是它阻止了页面的平行下载。HTTP/1.1 规范建议，浏览器每个主机名的并行下载内容不超过两个。如果你的图片放在多个主机名上，你可以在每个并行下载中同时下载2个以上的文件。但是当下载脚本时，浏览器就不会同时下载其它文件了，即便是主机名不相同。

Js放在底部加载其实并不影响浏览器展示页面,除非用户会在js加载完成之前就调用某个js方法,比如说页面刚展现到一半,但是恰好这一半里有一部分是调用了还未下载的js,这个时候就会出问题了,如果童子们遇到这种情况,可以把这部分js先加载.

Tags: 优化, 网站

星期四, 11 3 月, 2010 Web 没有评论

njava 发表在《在PhpStorm中使用Xdebug来调试php断点》
工仔发表在《在PhpStorm中使用Xdebug来调试php断点》
潍坊seo 发表在《WordPress All in one seo插件生成NoIndex对百度爬虫影响的解决方法》
猪立业发表在《由于Zend Optimizer的支持把ubuntu10.04下的php5.3降级到php5.2》
lazyducker 发表在《由于Zend Optimizer的支持把ubuntu10.04下的php5.3降级到php5.2》

1LMooBmUE153Wnd3zDryWvDyXxQudbFxDr

Web

discuz禁止某个版帖子的收录

1.使用robots.txt文件，禁止版块列表的收录

2.加meta robots标签，禁止收录某个版块帖子

discuz论坛禁止无效页面的收录

discuz会产生哪些无效的页面，有什么问题

修改提示信息页面，解决重复内容问题

方法二

discuz论坛的robots.txt文件设置

discuz论坛的robots.txt文件设置

搜索引擎对robots.txt的支持情况

各大搜索引擎网站登录入口

Syntax Highlighter WordPress Plugin

Overview

网站前端优化一些小经验

近期文章

近期评论

归档

链接表

比特币捐赠：

其他操作