Monday, April 22, 2013

Which Page is Canonical?

Generally every site have several pages with same set of products, a "Canonical Page" is the "preferred version of a set of pages with highly similar content". We are all still in a confusion that which page is a canonical page? Here we discuss about some common cases about canonical pages.
We generally think that a page is a physical file containing any of static or PHP or script code. But to a crawler, a page is nothing but any unique URL. One file may contain thousands of URLs and that each URL is a page for a crawler.

Let's take an example, in this example how many pages does a crawler crawls?

(A) “Static” Site
· www.example.com/
· www.example.com/store
· www.example.com/about
· www.example.com/contact
(B) PHP-based Site
· www.example.com/index.php
· www.example.com/store.php
· www.example.com/about.php
· www.example.com/contact.php
(C) Single-template Site
· www.example.com/index.php?page=home
· www.example.com/index.php?page=store
· www.example.com/index.php?page=about
· www.example.com/index.php?page=contact

The answer for the above question is "All", because for Google it doesn't matter about extensions, index.php or root pages. Google crawls all the above because all are unique URLs.
Let's see some other cases:

1. Tracking URLs: Many people are still using URL parameters to track visitors. Irrespective of the parameter and the purpose it is used for, it creates a duplicate page. For example:
· www.example.com/store.php?session=1234
· www.example.com/store.php?affiliate=5678
In this example, the session id and affiliate id creates a copy pages. In this case, the canonical URL is simply www.example.com/store.php

2. Dynamic URLs: 
Let's take some blog post URLs.
· www.example.com/blog/1234
· www.example.com/blog.php?id=1234
· www.example.com/blog.php?id=1234&comments=on
In the above example, it doesn't matter about the parameters or folders. So in this case if we use the canonical link to the blog, we are reducing our total blog into one page. So in this case the canonical URL must be like this www.example.com/blog/this-is-a-blog-post

3. The Home Page: Generally home pages spin a lot of variations. Commonly home page creates problems because it is the most internal and external linking page. For example:
· www.example.com
· www.example.com/
· www.example.com/default.html
· www.example.com/index.php
In this case the canonical URL would be mostly like this http://www.example.com/

4. Product Pages: Product pages are same as blog post pages as in case 2. For products also we use a lot of variations, including,
· www.example.com/store.php?id=1234
· www.example.com/store/1234
· www.example.com/store/this-is-a-product
If you have the URL like #3 then use the same URL as the canonical or if you don't have #3 then use #2 or if you don't have #2 then use #1 as canonical URL.
Like this we have lots of cases. All we need to know for canonical links is just we have to understand the architecture and crawl paths of the site. Before you add a bunch of canonical tags, first make sure that you understand the website and its crawl paths.

No comments:

Post a Comment