alan_beaulieu-learning_sql-ru (865932), страница 17
Текст из файла (страница 17)
Но как же получилось, что в результирующем наборе оказалось 54 строки? Приглядевшись, можно заметить, что каждый из 18 сотрудников встречаетсятрижды. При этом все его данные идентичны, кроме названия отдела.Поскольку запрос не определил, как должны быть соединены эти дветаблицы, сервер БД сгенерировал Декартово произведение, т. е. все возможные перестановки двух таблиц (18 сотрудников умножить на 3 отдела получается 54 перестановки). Такой тип соединения называют перекрестным соединением (cross join). Его редко используют (намеренно, по крайней мере).
Перекрестные соединения – один из типов соединений, которые будут изучаться в главе 10.Что такое соединение?93Внутренние соединенияЧтобы изменить предыдущий запрос и получить результирующий набор, включающий только 18 строк (по одной для каждого сотрудника),понадобится описать взаимосвязь двух таблиц. Я уже показал, чтосвязью между двумя таблицами служит столбец employee.dept_id, осталось только добавить эту информацию в подблок on блока from:mysql> SELECT e.fname, e.lname, d.name> FROM employee e JOIN department d> ON e.dept_id = d.dept_id;++++| fname| lname| name|++++| Susan| Hawthorne | Operations|| Helen| Fleming | Operations|| Chris| Tucker| Operations|| Sarah| Parker| Operations|| Jane| Grossman | Operations|| Paula| Roberts | Operations|| Thomas | Ziegler | Operations|| Samantha | Jameson | Operations|| John| Blake| Operations|| Cindy| Mason| Operations|| Frank| Portman | Operations|| Theresa | Markham | Operations|| Beth| Fowler| Operations|| Rick| Tulman| Operations|| John| Gooding | Loans|| Michael | Smith| Administration || Susan| Barker| Administration || Robert | Tyler| Administration |++++18 rows in set (0.00 sec)Теперь благодаря добавлению подблока on, предписывающего серверусоединять таблицы employee и department, прослеживая связь от однойтаблицы к другой по столбцу dept_id, имеем вместо 54 строк ожидаемые 18.
Например, строка Сьюзен Хоторн (Susan Hawthorne) в таблице employee в столбце dept_id содержит 1 (в примере не показано). Сервер использует это значение для поиска строки в таблице department,столбец dept_id которой содержит 1, и извлекает значение 'Operations'из столбца name этой строки.Если определенное значение столбца dept_id присутствует в одной таблице, но его нет в другой, соединение строк не происходит, и они невключаются в результирующий набор. Такой тип соединения называют внутренним соединением (inner join); это наиболее широко используемый тип соединения.
Поясню: если в таблице department есть четвертая строка для отдела маркетинга, но ни один сотрудник не приписанк нему, отдел маркетинга не попадет в результирующий набор. Анало94Глава 5. Запрос к нескольким таблицамгично, если некоторые сотрудники зарегистрированы в отделе с ID 99,которого нет в таблице department, эти сотрудники не попадут в результирующий набор. Если требуется включить все строки той или инойтаблицы независимо от наличия соответствия, можно воспользоватьсявнешним соединением (outer join), но мы рассмотрим это в главе 10.В предыдущем примере в блоке from я не указал тип используемого соединения. Однако если требуется соединить две таблицы путем внутреннего соединения, это следует явно указать в блоке from.
Вот тот жепример с добавлением типа соединения (обратите внимание на ключевое слово INNER (внутренний)):mysql> SELECT e.fname, e.lname, d.name> FROM employee e INNER JOIN department d> ON e.dept_id = d.dept_id;++++| fname| lname| name|++++| Susan| Hawthorne | Operations|| Helen| Fleming | Operations|| Chris| Tucker| Operations|| Sarah| Parker| Operations|| Jane| Grossman | Operations|| Paula| Roberts | Operations|| Thomas | Ziegler | Operations|| Samantha | Jameson | Operations|| John| Blake| Operations|| Cindy| Mason| Operations|| Frank| Portman | Operations|| Theresa | Markham | Operations|| Beth| Fowler| Operations|| Rick| Tulman| Operations|| John| Gooding | Loans|| Michael | Smith| Administration || Susan| Barker| Administration || Robert | Tyler| Administration |++++18 rows in set (0.00 sec)Если тип соединения не задан, сервер по умолчанию проведет внутреннее соединение.
Однако, как выяснится в главе 10, есть несколько типов соединений, поэтому указание точного типа требуемого соединения должно войти в привычку.Если имена столбцов, используемых для соединения двух таблиц, совпадают (что имеет место в предыдущем запросе), можно вместо подблока on применить подблок using:mysql> SELECT e.fname, e.lname, d.name> FROM employee e INNER JOIN department d> USING (dept_id);++++Что такое соединение?95| fname| lname| name|++++| Susan| Hawthorne | Operations|| Helen| Fleming | Operations|| Chris| Tucker| Operations|| Sarah| Parker| Operations|| Jane| Grossman | Operations|| Paula| Roberts | Operations|| Thomas | Ziegler | Operations|| Samantha | Jameson | Operations|| John| Blake| Operations|| Cindy| Mason| Operations|| Frank| Portman | Operations|| Theresa | Markham | Operations|| Beth| Fowler| Operations|| Rick| Tulman| Operations|| John| Gooding | Loans|| Michael | Smith| Administration || Susan| Barker| Administration || Robert | Tyler| Administration |++++18 rows in set (0.01 sec)Поскольку using – сокращенная запись, которая может использоваться только в определенной ситуации, во избежание путаницы я всегдапредпочитаю подблок on.ANSIсинтаксис соединенияНотация, используемая в данной книге для соединения таблиц, былавведена в версии SQL92 стандарта ANSI SQL.
Во всех основных СУБД(Oracle Database, Microsoft SQL Server, MySQL, IBM DB2 Universal Database, Sybase Adaptive Server) принят синтаксис соединения SQL92.Поскольку многие серверы существовали еще до выхода спецификации SQL92, все они включают и старый синтаксис соединения. Например, всем этим серверам был бы понятен такой вариант предыдущегозапроса:mysql> SELECT e.fname, e.lname, d.name> FROM employee e, department d> WHERE e.dept_id = d.dept_id;++++| fname| lname| name|++++| Susan| Hawthorne | Operations|| Helen| Fleming | Operations|| Chris| Tucker| Operations|| Sarah| Parker| Operations|| Jane| Grossman | Operations|| Paula| Roberts | Operations|| Thomas | Ziegler | Operations|96Глава 5. Запрос к нескольким таблицам| Samantha | Jameson | Operations|| John| Blake| Operations|| Cindy| Mason| Operations|| Frank| Portman | Operations|| Theresa | Markham | Operations|| Beth| Fowler| Operations|| Rick| Tulman| Operations|| John| Gooding | Loans|| Michael | Smith| Administration || Susan| Barker| Administration || Robert | Tyler| Administration |++++18 rows in set (0.01 sec)Этот старый метод описания соединений не включает подблок on.
Таблицы указаны в блоке from через запятую, а условия соединения включены в блок where. Хотя можно игнорировать синтаксис SQL92 в пользу старого синтаксиса соединений, у синтаксиса ANSI есть следующиепреимущества:• Условия соединения и фильтрации разнесены в два разных блока(подблок on и блок where соответственно), что упрощает пониманиезапроса.• Условия соединения для каждой пары таблиц содержатся в собственном блоке on, что уменьшает вероятность ошибочного исключения части соединения.• Запросы, использующие синтаксис соединения SQL92, портируются на разные серверы БД, тогда как старый синтаксис немного отличается для каждого сервера.Преимущества синтаксиса соединения SQL92 заметнее в сложных запросах, включающих как условия соединения, так и условия фильтрации. Рассмотрим следующий запрос, по которому возвращаются всесчета, открытые опытными операционистами (нанятыми до 2003 года), в настоящее время приписанными к отделению Woburn:mysql> SELECT a.account_id, a.cust_id, a.open_date, a.product_cd> FROM account a, branch b, employee e> WHERE a.open_emp_id = e.emp_id> AND e.start_date <= '20030101'> AND e.assigned_branch_id = b.branch_id> AND (e.title = 'Teller' OR e.title = 'Head Teller')> AND b.name = 'Woburn Branch';+++++| account_id | cust_id | open_date | product_cd |+++++|1 |1 | 20000115 | CHK||2 |1 | 20000115 | SAV||3 |1 | 20040630 | CD||4 |2 | 20010312 | CHK||5 |2 | 20010312 | SAV|Соединение трех и более таблиц97|14 |7 | 20040112 | CD||22 |11 | 20040322 | BUS|+++++7 rows in set (0.01 sec)В этом запросе не так просто определить, какие условия блока whereявляются условиями соединения, а какие – условиями фильтрации.Также не вполне очевидно, какой тип соединения используется (дляустановления типа соединения необходимо внимательно рассмотретьусловия соединения в блоке where – нет ли там какихлибо специальных символов), и сложно определить, не были ли упущены какиелибоусловия соединения.