Para entender el post necesitas: Tener conocimientos de SQL, aunque no necesariamente de SQL Server (otra cosa es que te sea útil si no lo utilizas).

Cuando uno está acostumbrado al comportamiento de un motor de base de datos específico, iniciarse con uno distinto puede resultar un problema; ya que es normal encontrar casos particulares en los que el comportamiento de uno y otro difieren, sobre todo a la hora de manejar valores nulos.

En mi caso, ya estaba acostumbrado a trabajar con la base de datos Informix de la compañía IBM, de las más potentes y rápidas que he utilizado sin lugar a dudas, cuando empecé a utilizar / experimentar la versión Express de SQL Server 2005. Tenía que migrar una aplicación de un lenguaje (Dynamic 4GL) a su nueva versión harto mejorada (Genero 4GL) y de una base de datos a otra.

Todo fue bien hasta que tuve que hacer una SQL con un "potito" OUTER JOIN.

En el programa en cuestión, necesitabamos relacionar la tabla de artículos con la tabla de existencias, pero queríamos que salieran todos los artículos que pertenecieran, por ejemplo, a la familia 'AJUSA', sin importar si existía o no el registro correspondiente en la tabla de existencias. Además, para el presente ejemplo, sólo vamos a consultar el año 2008.

La consulta a ejecutar en Informix es muy simple:

SELECT articulo.*,existencia.*
FROM articulo, OUTER existencia
WHERE articulo.fam_art = existencia.fam_art
AND articulo.cod_art = existencia.cod_art
AND articulo.fam_art = 'AJUSA'
AND existencia.ejercicio = 2008
ORDER BY articulo.fam_art

Para comprobar que la sentencia es correcta, basta con hacer un SELECT COUNT de los registros de la tabla de artículos cuya familia sea 'AJUSA' y compararlo con el resultante de esta misma consulta. Ambas sentencias devolverán el mismo número de registros. Y si tenemos pocos artículos podemos asegurarnos comparando, os aseguro que no falla.

Ahora bien, si hacemos la consulta equivalente en SQL Server, que sería:

SELECT articulo.*,existencia.*
FROM existencia RIGHT OUTER JOIN articulo
ON existencia.fam_art = articulo.fam_art
AND existencia.cod_art = articulo.cod_art
WHERE articulo.fam_art = 'AJUSA'
AND existencia.ejercicio = 2008
ORDER BY articulo.fam_art

Tendremos una desagradable sorpresa; ya que sólo devolverá los registros que en ambas tablas existan con los criterios especificados o, lo que es lo mismo, HACE UN PUTO INNER JOIN.

Rebuscando por ahí encontré esta página en el que veía confirmada esta afirmación y la forma de solucionar el problema. La forma de trabajar de SQL Server es un poco especialita, por decirlo suavemente: primero se hace el filtrado de la clausula WHERE y ¡¡DESPUÉS!! el OUTER JOIN.

La solución propuesta en la web de sqlteam consiste en incluir los criterios de selección en la clausula ON del OUTER JOIN. Para que nos entendamos, si queremos sacar TODOS los artículos relacionados con la tabla de existencias que sean del 2008 (existan o no en esta tabla); la consulta necesaria sería:

SELECT articulo.*,existencia.*
FROM existencia RIGHT OUTER JOIN articulo
ON existencia.fam_art = articulo.fam_art
AND existencia.cod_art = articulo.cod_art
AND existencia.ejercicio = 2008

Pero en nuestro caso tenemos un problema adicional; y es que sólo necesitamos los artículos cuya familia es 'AJUSA'. El campo fam_art forma parte del OUTER JOIN, con lo que esta condición sería ignorada por el motor de la base de datos; de modo que la consulta:

SELECT articulo.*,existencia.*
FROM existencia RIGHT OUTER JOIN articulo
ON existencia.fam_art = articulo.fam_art
AND existencia.cod_art = articulo.cod_art
AND articulo.fam_art = 'AJUSA'
AND existencia.ejercicio = 2008

... daría el mismo resultado que la sentencia SQL anterior; vamos, que saca todos los artículos tengan o no tengan existencias en el 2008.

Pero la solución está cerca atendiendo al orden de ejecución de las clausulas, porque lo que debemos hacer es utilizar la clausula ON para indicar los filtros sobre la tabla en la que se especifica el OUTER (en nuestro caso, '"existencia") y después emplear la clausula WHERE para la tabla de la que queremos extraer todos los registros ("articulo" en este ejemplo):

SELECT articulo.*,existencia.*
FROM existencia RIGHT OUTER JOIN articulo
ON existencia.fam_art = articulo.fam_art
AND existencia.cod_art = articulo.cod_art
AND existencia.ejercicio = 2008
WHERE articulo.fam_art = 'AJUSA'

Esta consulta devuelve los registros que deseábamos obtener.

Los OUTER JOIN se utilizan muy rara vez y es difícil encontrar información sobre este dichoso problema; así pues, decidí que tan preciada información tenía que estar en este blog, que tantas visitas recibe, para que el conocimiento se propague rápidamente XD.