大数据第24天-子查询-杨大伟

Posted shui68home

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据第24天-子查询-杨大伟相关的知识,希望对你有一定的参考价值。

   1 cd /d D:MyWorkmysqlmysql-5.7.28-winx64in rem 目的是为了执行mysql.exe
   2 mysql -h127.0.0.1 -P3306 -uroot -p123456 rem 作用是为了让客户端能够正确的连接服务器
   3 mysql --host=127.0.0.1 --port=3306 --user=root --password=123456 world
   4 
   5 -- 查看服务器中有哪些数据库
   6 show databases;
   7 
   8 -- 创建新的数据库
   9 create database company;
  10 
  11 -- 切换工作数据库
  12 use company;
  13 
  14 -- 查看当前数据库中的表
  15 show tables;
  16 
  17 -- 导入.sql文件中的数据
  18 source d:/company.sql;
  19 
  20 -- 查看表中的数据
  21 select * from employees;
  22 
  23 -- 练习 : 创建world数据库, 并切换, 再导入world.sql文件中的数据到world库.
  24 create database world;
  25 
  26 use world;
  27 
  28 source d:/world.sql;
  29 
  30 -- 丢弃数据库
  31 drop database company;
  32 
  33 drop database world;
  34 
  35 -- 查看当前工作数据库
  36 select database();
  37 
  38 -- 查看当前工作数据库的版本
  39 select version();
  40 
  41 -- 查看服务器所有参数
  42 show variables;
  43 
  44 -- 和字符集设置相关的参数 : 
  45 character_set_client                                     | gbk
  46 character_set_connection                                 | gbk
  47 character_set_database                                   | utf8
  48 character_set_filesystem                                 | binary
  49 character_set_results                                    | gbk
  50 character_set_server                                     | utf8
  51 character_set_system                                     | utf8
  52 
  53 -- 如果client,connection和result的设置不是gbk, 必须执行以下语句
  54 
  55 -- 修改客户端编码
  56 set names gbk;
  57 
  58 数据库结构
  59     mysqld 服务器
  60         数据库1(目录形式)
  61             表1
  62                 数据(记录)1
  63                 数据(记录)2
  64                 数据(记录)3
  65                 ....
  66             表2 
  67             表3
  68             ....
  69             
  70         数据库2
  71         ......
  72         
  73 -- 查看表中数据
  74 select * from 表名; 
  75 
  76 -- 查看表结构
  77 describe employees;
  78 desc employees;
  79 
  80 +----------------+--------------+------+-----+---------+----------------+
  81 | Field          | Type         | Null | Key | Default | Extra          |
  82 +----------------+--------------+------+-----+---------+----------------+
  83 | employee_id    | int(6)       | NO   | PRI | NULL    | auto_increment |
  84 | first_name     | varchar(20)  | YES  |     | NULL    |                |
  85 | last_name      | varchar(25)  | YES  |     | NULL    |                |
  86 | email          | varchar(25)  | YES  |     | NULL    |                |
  87 | phone_number   | varchar(20)  | YES  |     | NULL    |                |
  88 | job_id         | varchar(10)  | YES  | MUL | NULL    |                |
  89 | salary         | double(10,2) | YES  |     | NULL    |                |
  90 | commission_pct | double(4,2)  | YES  |     | NULL    |                |
  91 | manager_id     | int(6)       | YES  |     | NULL    |                |
  92 | department_id  | int(4)       | YES  | MUL | NULL    |                |
  93 +----------------+--------------+------+-----+---------+----------------+
  94 
  95 create table customer(
  96     id int,
  97     name varchar(20),
  98     age int,
  99     phone varchar(15),
 100     birthday date
 101 );
 102 
 103 insert into customer (
 104     id,
 105     name,
 106     age,
 107     phone,
 108     birthday
 109 ) values (
 110     1,
 111     ‘张三‘,
 112     30,
 113     ‘134234234‘,
 114     ‘1992-5-8‘
 115 );
 116 
 117 insert into customer (
 118     id,
 119     name,
 120     age,
 121     phone,
 122     birthday
 123 ) values (
 124     2,
 125     ‘李四‘,
 126     40,
 127     ‘1599234234‘,
 128     ‘1991-5-8‘
 129 );
 130 
 131 insert into customer (
 132     id,
 133     name,
 134     age,
 135     phone,
 136     birthday
 137 ) values (
 138     3,
 139     ‘王五‘,
 140     50,
 141     ‘135234234‘,
 142     ‘1995-11-8‘
 143 );
 144 
 145 -- 更新记录(修改数据)
 146 -- 如果更新时不加where过滤, 会导致所有数据被修改
 147 update customer set 
 148     name = ‘某人‘,
 149     age = 10;
 150     
 151 update customer set 
 152     name = ‘张三‘,
 153     age = 30
 154 where 
 155     id = 1;
 156     
 157 -- 删除记录
 158 -- 如果没有where过滤, 会全部删除.
 159 delete from customer;
 160 
 161 delete from customer 
 162 where id = 2;
 163 
 164 
 165 DML 数据操纵语言.
 166 insert C
 167 select R 
 168 update U
 169 delete D
 170 
 171 +----------------+---------------------------------------------------------------------------------------+------+-----+---------+-------+
 172 | Field          | Type                                                                                  | Null | Key | Default | Extra |
 173 +----------------+---------------------------------------------------------------------------------------+------+-----+---------+-------+
 174 | Code           | char(3)   国家代码                                                                            | NO   | PRI |         |       |
 175 | Name           | char(52)  国家名称                                                                    | NO   |     |         |       |
 176 | Continent      | enum(‘Asia‘,‘Europe‘,‘North America‘,‘Africa‘,‘Oceania‘,‘Antarctica‘,‘South America‘) | NO   |     | Asia    |       |
 177 | Region         | char(26)          地区                                                                    | NO   |     |         |       |
 178 | SurfaceArea    | float(10,2)       国土面积m                                                                    | NO   |     | 0.00    |       |
 179 | IndepYear      | smallint(6)       独立年                                                                   | YES  |     | NULL    |       |
 180 | Population     | int(11)           国家人口                                                              | NO   |     | 0       |       |
 181 | LifeExpectancy | float(3,1)        平均寿命                                                                    | YES  |     | NULL    |       |
 182 | GNP            | float(10,2)       国民生产总值                                                                    | YES  |     | NULL    |       |
 183 | GNPOld         | float(10,2)                                                                           | YES  |     | NULL    |       |
 184 | LocalName      | char(45)                                                                              | NO   |     |         |       |
 185 | GovernmentForm | char(45)          政府组织                                                                    | NO   |     |         |       |
 186 | HeadOfState    | char(60)          领导人                                                                    | YES  |     | NULL    |       |
 187 | Capital        | int(11)           首都                                                                    | YES  |     | NULL    |       |
 188 | Code2          | char(2)                                                                                   | NO   |     |         |       |
 189 +----------------+---------------------------------------------------------------------------------------+------+-----+---------+-------+
 190 city
 191 +-------------+----------+------+-----+---------+----------------+
 192 | Field       | Type     | Null | Key | Default | Extra          |
 193 +-------------+----------+------+-----+---------+----------------+
 194 | ID          | int(11)  | NO   | PRI | NULL    | auto_increment |
 195 | Name        | char(35) | NO   |     |         |                |
 196 | CountryCode | char(3)  | NO   | MUL |         |                |
 197 | District    | char(20) | NO   |     |         |                |
 198 | Population  | int(11)  | NO   |     | 0       |                |
 199 +-------------+----------+------+-----+---------+----------------+
 200 SELECT *
 201 FROM   departments;
 202 
 203 SELECT department_id, location_id
 204 FROM   departments;
 205 
 206 select 
 207     code,
 208     name,
 209     continent
 210 from 
 211     country;
 212     
 213 select 
 214     continent,
 215     name,
 216     code
 217 from 
 218     country;
 219 
 220 SQL注意点 :     
 221     SQL 语言大小写不敏感。 
 222     SQL 可以写在一行或者多行
 223     关键字不能被缩写也不能分行
 224     各子句一般要分行写。
 225     使用缩进提高语句的可读性。
 226     
 227 -- 查询国家的人口,名称和代码及首都.
 228 select 
 229     population,
 230     name,
 231     code,
 232     capital
 233 from 
 234     country;
 235 
 236 -- AS用于给列起别名, AS关键字可以省略
 237 SELECT last_name AS name, commission_pct comm
 238 FROM   employees;
 239 
 240 -- 别名可以使用""包围, 目的是让它能原样显示或包含特殊的符号
 241 select 
 242     code 国家代码,
 243     name,
 244     continent as "国家 大洲"
 245 from 
 246     country;
 247 
 248 -- 过滤行 where 条件布尔 : 工作流程就是从基本表中测试每行数据, 都经过条件布尔测试一下, 如果结果为真留下, 为假则丢弃.     
 249 SELECT employee_id, last_name, job_id, department_id
 250 FROM   employees
 251 WHERE  department_id = 90 ;
 252 
 253 -- 查询所有亚洲国家
 254 select 
 255     code,
 256     population,
 257     name
 258 from 
 259     country 
 260 where 
 261     continent = ‘asia‘;
 262     
 263 -- 查询所有亚洲国家 , 下面的SQL是错误的, where中不可以使用列的别名, 因为where先执行.
 264 select 
 265     code,
 266     population,
 267     name,
 268     continent cont
 269 from 
 270     country 
 271 where 
 272     cont = ‘asia‘;
 273     
 274 执行顺序 : from => where => select 
 275 
 276 --查询所有中国城市的人口和名称和id号和国家代码, 给国家代码起别名, 尝试在where中使用别名.
 277 select 
 278     population,
 279     name,
 280     id,
 281     countrycode code 
 282 from 
 283     city 
 284 where 
 285     countrycode = ‘chn‘;
 286 
 287 -- between a and b --等效于salary >= a && salary <= 3500    
 288 SELECT last_name, salary
 289 FROM   employees
 290 WHERE  salary BETWEEN 2500 AND 3500;
 291 
 292 -- id in(a, b, c) -- 等效于id = a || id = b || id = c 
 293 SELECT employee_id, last_name, salary, manager_id
 294 FROM   employees
 295 WHERE  manager_id IN (100, 101, 201);
 296 
 297 select 
 298     code,
 299     continent,
 300     name,
 301     population
 302 from 
 303     country 
 304 where 
 305     name like ‘china‘; -- name = ‘china‘ 如果模糊查询中的字符串没有通配符, 和=效果一样.
 306     
 307 SELECT    first_name
 308 FROM     employees
 309 WHERE    first_name LIKE ‘S%‘;
 310 
 311 % 代表任意个任意字符
 312 _ 代表一个任意字符
 313 -- 查询国家名称中只要包含ch的都行
 314 
 315 select 
 316     code,
 317     population,
 318     name,
 319     continent 
 320 from 
 321     country 
 322 where 
 323     name like ‘%ch%‘
 324     
 325 -- 名字中第3个和第4个是in的国家
 326 select 
 327     code,
 328     population,
 329     name,
 330     continent 
 331 from 
 332     country 
 333 where 
 334     name like ‘__in%‘
 335     
 336 -- 查询城市表中, 名称的第2个和3个字母是or的城市.
 337 select 
 338     id,
 339     name,
 340     countrycode 
 341 from 
 342     city 
 343 where 
 344     name like ‘_or%‘;
 345     
 346 -- 查看哪些国家没有首都
 347 -- null和任意的比较运算, 结果一定是false, 处理null, 必须使用特殊的is来判断
 348 -- null值在进行统计时会被自动忽略.
 349 select 
 350     code,
 351     name,
 352     continent,
 353     capital
 354 from 
 355     country 
 356 where 
 357     capital = null;
 358     
 359 select 
 360     code,
 361     name,
 362     continent,
 363     capital
 364 from 
 365     country 
 366 where 
 367     capital is null;
 368     
 369 select 
 370     code,
 371     name,
 372     continent,
 373     capital
 374 from 
 375     country 
 376 where 
 377     capital is not null;
 378 
 379 -- 哪些国家尚未独立.
 380 select 
 381     name,
 382     code,
 383     indepYear
 384 from 
 385     country 
 386 where 
 387     indepYear is null;
 388 
 389 
 390 SELECT 
 391     employee_id, last_name, job_id, salary
 392 FROM   employees
 393 WHERE  
 394         salary >=10000
 395     AND    
 396         job_id LIKE ‘%MAN%‘;
 397 
 398 
 399 SELECT 
 400     employee_id, last_name, job_id, salary
 401 FROM   employees
 402 WHERE  
 403         salary >= 10000
 404     OR     
 405         job_id LIKE ‘%MAN%‘;
 406 
 407 -- 查询亚洲国家中人口大于5000万的国家.
 408 select 
 409     code,
 410     name,
 411     continent,
 412     population
 413 from 
 414     country 
 415 where 
 416         continent = ‘asia‘
 417     and 
 418         population > 50000000;
 419 
 420 -- 查询中国的城市人口小于20万的城市.
 421 select 
 422     *
 423 from 
 424     city 
 425 where 
 426     countrycode = ‘chn‘
 427     and 
 428     population < 200000;
 429     
 430 -- 去重 distinct, 后面的列最好是有重复数据的
 431 select 
 432     distinct 
 433         continent,
 434         region
 435 from 
 436     country;
 437     
 438 -- 查看中国各有哪些不同的省.
 439 select 
 440     distinct district
 441 from 
 442     city 
 443 where 
 444     countrycode = ‘chn‘;
 445 
 446 SELECT   last_name, job_id, department_id, salary
 447 FROM     employees
 448 ORDER BY salary asc;
 449 
 450 SELECT   last_name, job_id, department_id, salary
 451 FROM     employees
 452 ORDER BY salary desc;
 453 
 454 select 
 455     code,
 456     name,
 457     population pop 
 458 from 
 459     country 
 460 where 
 461     continent = ‘asia‘
 462 order by 
 463     pop;
 464 
 465 order by中可以使用列的别名, 原因是它最后执行
 466 
 467 顺序 : from => where => select => order by 
 468 
 469 
 470 SELECT last_name, department_id, salary
 471 FROM   employees
 472 ORDER BY department_id asc, salary DESC;
 473 
 474 -- 查询亚洲人口最少的国家
 475 select 
 476     code,
 477     name,
 478     continent,
 479     population pop 
 480 from 
 481     country 
 482 where 
 483     continent = ‘asia‘
 484 order by 
 485     pop desc;
 486 
 487 -- 查询山东省人口最多的城市
 488 select 
 489     id,
 490     name,
 491     district,
 492     population
 493 from 
 494     city 
 495 where 
 496         countrycode = ‘chn‘
 497     and 
 498         district = ‘shandong‘
 499 order by 
 500     population
 501     
 502 
 503     
 504 -- 多表联接 : 会产生笛卡尔集
 505 -- 为了学习, 创建简单表
 506 create table city2
 507 select * from city where name=‘london‘;
 508 +------+--------+-------------+----------+------------+
 509 | ID   | Name   | CountryCode | District | Population |
 510 +------+--------+-------------+----------+------------+
 511 |  456 | London | GBR         | England  |    7285000 |
 512 | 1820 | London | CAN         | Ontario  |     339917 |
 513 +------+--------+-------------+----------+------------+
 514 
 515 create table country2
 516 select * from country where code in(‘gbr‘, ‘can‘);
 517 +------+----------------+---------------+-----------------+-------------+-----------+------------+----------------+------------+------------+-------------
 518 | Code | Name           | Continent     | Region          | SurfaceArea | IndepYear | Population | LifeExpectancy | GNP        | GNPOld     | LocalName
 519 +------+----------------+---------------+-----------------+-------------+-----------+------------+----------------+------------+------------+-------------
 520 | CAN  | Canada         | North America | North America   |  9970610.00 |      1867 |   31147000 |           79.4 |  598862.00 |  625626.00 | Canada
 521 | GBR  | United Kingdom | Europe        | British Islands |   242900.00 |      1066 |   59623400 |           77.7 | 1378330.00 | 1296830.00 | United Kingd
 522 +------+----------------+---------------+-----------------+-------------+-----------+------------+----------------+------------+------------+-------------
 523 
 524 select * from city2, country2; 
 525 结果集中的绝大多数都是垃圾. 必须要过滤掉
 526 +------+--------+-------------+----------+------------+------+----------------+---------------+-----------------+-------------+-----------+------------+--
 527 | ID   | Name   | CountryCode | District | Population | Code | Name           | Continent     | Region          | SurfaceArea | IndepYear | Population | L
 528 +------+--------+-------------+----------+------------+------+----------------+---------------+-----------------+-------------+-----------+------------+--
 529 |  456 | London | GBR         | England  |    7285000 | CAN  | Canada         | North America | North America   |  9970610.00 |      1867 |   31147000 |
 530 | 1820 | London | CAN         | Ontario  |     339917 | CAN  | Canada         | North America | North America   |  9970610.00 |      1867 |   31147000 |
 531 |  456 | London | GBR         | England  |    7285000 | GBR  | United Kingdom | Europe        | British Islands |   242900.00 |      1066 |   59623400 |
 532 | 1820 | London | CAN         | Ontario  |     339917 | GBR  | United Kingdom | Europe        | British Islands |   242900.00 |      1066 |   59623400 |
 533 +------+--------+-------------+----------+------------+------+----------------+---------------+-----------------+-------------+-----------+------------+--
 534 
 535 select 
 536     * 
 537 from 
 538     city2, 
 539     country2
 540 where 
 541     countrycode = code;
 542     
 543 +------+--------+-------------+----------+------------+------+----------------+---------------+-----------------+-------------+-----------+------------+-
 544 | ID   | Name   | CountryCode | District | Population | Code | Name           | Continent     | Region          | SurfaceArea | IndepYear | Population |
 545 +------+--------+-------------+----------+------------+------+----------------+---------------+-----------------+-------------+-----------+------------+-
 546 | 1820 | London | CAN         | Ontario  |     339917 | CAN  | Canada         | North America | North America   |  9970610.00 |      1867 |   31147000 |
 547 |  456 | London | GBR         | England  |    7285000 | GBR  | United Kingdom | Europe        | British Islands |   242900.00 |      1066 |   59623400 |
 548 +------+--------+-------------+----------+------------+------+----------------+---------------+-----------------+-------------+-----------+------------+-
 549 
 550 -- 下面的SQL是错误的, 因为列名模糊
 551 select 
 552     name,
 553     population,
 554     name,
 555     continent,
 556     population
 557 from 
 558     city2, 
 559     country2
 560 where 
 561     countrycode = code;
 562     
 563 select 
 564     city2.name as cityName,
 565     city2.population cityPop,
 566     country2.name countryName,
 567     country2.continent,
 568     country2.population countryPop
 569 from 
 570     city2, 
 571     country2
 572 where 
 573     city2.countrycode = country2.code;
 574     
 575 -- 表名的使用也麻烦了. 给表起别名    
 576 select 
 577     ci.name as cityName,
 578     ci.population cityPop,
 579     co.name countryName,
 580     co.continent,
 581     co.population countryPop
 582 from 
 583     city2 as ci , 
 584     country2 co 
 585 where 
 586     ci.countrycode = co.code;
 587 
 588 -- 表名一旦指定了别名, 原名就不可以使用了.
 589 select 
 590     city2.name as cityName,
 591     city2.population cityPop,
 592     country2.name countryName,
 593     country2.continent,
 594     country2.population countryPop
 595 from 
 596     city2 as ci, 
 597     country2 as co 
 598 where 
 599     city2.countrycode = country2.code;
 600     
 601 -- 查询所有国家的名称和国家的首都的名称.
 602 select 
 603     co.name country,
 604     ci.name captial,
 605     co.population countryPop,
 606     ci.population cityPop,
 607     co.continent 
 608 from 
 609     country co,
 610     city ci 
 611 where 
 612     co.capital = ci.id
 613     
 614 -- where中有多个条件.
 615 select 
 616     ci.name as cityName,
 617     ci.population cityPop,
 618     co.name countryName,
 619     co.continent,
 620     co.population countryPop
 621 from 
 622     city2 as ci , 
 623     country2 co 
 624 where 
 625         ci.countrycode = co.code -- 联接条件, 比普通过滤更重要.
 626     and 
 627         ci.population > 1000000
 628         
 629 +----------+---------+----------------+-----------+------------+
 630 | cityName | cityPop | countryName    | continent | countryPop |
 631 +----------+---------+----------------+-----------+------------+
 632 | London   | 7285000 | United Kingdom | Europe    |   59623400 |
 633 +----------+---------+----------------+-----------+------------+
 634 
 635 SQL99标准中 内联接不要用,号来写, 而是使用专门的关键字join.... on 联接条件
 636 select 
 637     ci.name as cityName,
 638     ci.population cityPop,
 639     co.name countryName,
 640     co.continent,
 641     co.population countryPop
 642 from 
 643     city2 as ci 
 644 inner join 
 645     country2 co 
 646 on 
 647     ci.countrycode = co.code 
 648 where 
 649     ci.population > 1000000;
 650     
 651 -- on 和 where 效果相同, 但是下面的写法不推荐
 652 select 
 653     ci.name as cityName,
 654     ci.population cityPop,
 655     co.name countryName,
 656     co.continent,
 657     co.population countryPop
 658 from 
 659     city2 as ci 
 660 inner join 
 661     country2 co 
 662 where 
 663         ci.countrycode = co.code 
 664     and 
 665         ci.population > 1000000;
 666     
 667 -- on 和 where 效果相同, 但是下面的写法不推荐    
 668 select 
 669     ci.name as cityName,
 670     ci.population cityPop,
 671     co.name countryName,
 672     co.continent,
 673     co.population countryPop
 674 from 
 675     city2 as ci 
 676 inner join 
 677     country2 co 
 678 on 
 679         ci.countrycode = co.code 
 680     and 
 681         ci.population > 1000000;
 682     
 683 -- 最好的写法是下面的.    inner关键字可以省略
 684 select 
 685     ci.name as cityName,
 686     ci.population cityPop,
 687     co.name countryName,
 688     co.continent,
 689     co.population countryPop
 690 from 
 691     city2 as ci 
 692 join 
 693     country2 co 
 694 on -- on后面只跟 联接条件 
 695     ci.countrycode = co.code 
 696 where -- where 后面只跟  普通行过滤
 697     ci.population > 1000000;
 698     
 699 -- 查询所有亚洲和欧洲国家的首都, 使用SQL99
 700 select 
 701     co.name country,
 702     co.continent,
 703     ci.name capital
 704 from 
 705     country co 
 706 join 
 707     city ci 
 708 on 
 709     co.capital = ci.id 
 710 where 
 711     co.continent in(‘asia‘, ‘europe‘);
 712     
 713 -- 查看所有国家名称和首都及官方语言
 714 select 
 715     co.name country,
 716     co.continent,
 717     ci.name capital,
 718     cl.language
 719 from 
 720     country co 
 721 join 
 722     city ci 
 723 on 
 724     co.capital = ci.id 
 725 join 
 726     countrylanguage cl 
 727 on 
 728     cl.countrycode = co.code 
 729 where 
 730     cl.isofficial = ‘t‘;
 731     
 732 -- 查询简单表的国家及首都
 733 -- 内联接的结果总是所有联接条件为真的记录. 为假的记录全部滤掉.
 734 select 
 735     co.name country,
 736     ci.name capital,
 737     ci.district
 738 from 
 739     country2 co 
 740 join 
 741     city2 ci 
 742 on 
 743     co.capital = ci.id;
 744     
 745     
 746 -- 外联接可以保证某张表的数据完整, 即使联接条件为假, 也要保留数据
 747 select 
 748     co.name country,
 749     ci.name capital,
 750     ci.district
 751 from 
 752     country2 co 
 753 left outer join 
 754     city2 ci 
 755 on 
 756     co.capital = ci.id;
 757     
 758 select 
 759     co.name country,
 760     ci.name capital,
 761     ci.district
 762 from 
 763     country2 co 
 764 right outer join 
 765     city2 ci 
 766 on 
 767     co.capital = ci.id;
 768     
 769 -- 查看所有国家名称和首都, 即使没有首都也要显示.
 770 select 
 771     co.name country,
 772     co.continent,
 773     ci.name capital
 774 from 
 775     country co 
 776 left join 
 777     city ci 
 778 on 
 779     co.capital = ci.id;
 780 
 781 -- 查询哪些国家没有首都
 782 select 
 783     co.name country,
 784     co.continent,
 785     ci.name capital
 786 from 
 787     country co 
 788 left join 
 789     city ci 
 790 on 
 791     co.capital = ci.id
 792 where 
 793     ci.name is null;
 794     
 795 // 伪代码
 796 // 内联接
 797 Set leftTable;
 798 Set rightTable;
 799 Set resultSet = new Set();
 800 for (int i = 0; i < leftTable.length; i++) {
 801     Row leftRow = leftTable[i];
 802     for (int j = 0; j < rightTable.length; j++) {
 803         Row rightRow = rightTable[j];
 804         if (联接条件(leftRow, rightRow)) {
 805             Row newRow = leftRow + rightRow;
 806             resultSet.add(newRow);
 807         }
 808     }
 809 }
 810 
 811 // 外联接 
 812 Set leftTable;
 813 Set rightTable;
 814 Set resultSet = new Set();
 815 for (int i = 0; i < leftTable.length; i++) {
 816     Row leftRow = leftTable[i];
 817     boolean flag = false;
 818     for (int j = 0; j < rightTable.length; j++) {
 819         Row rightRow = rightTable[j];
 820         if (联接条件(leftRow, rightRow)) {
 821             Row newRow = leftRow + rightRow;
 822             resultSet.add(newRow);
 823             flag = true; // 表明联接条件为真的记录保存起来
 824         }
 825     }
 826     
 827     if (!flag) {
 828         Row newRow = leftRow + 空行(右表);
 829         resultSet.add(newRow);
 830     }
 831 }
 832 
 833 -- 查询哪些国家没有官方语言
 834 select 
 835     co.name country,
 836     cl.language,
 837     cl.isofficial
 838 from 
 839     country co 
 840 left join 
 841     countrylanguage cl 
 842 on 
 843         co.code = cl.countrycode
 844     and 
 845         cl.isofficial = ‘T‘
 846 where 
 847     cl.isofficial is null
 848     
 849 -- 查询所有国家的首都和官方语言, 没有首都和官方语言的也要全部显示.
 850 
 851 -- 单行函数, 查询结果中对每一行都单独执行的函数
 852 select
 853     upper(name),
 854     lower(continent)
 855 from 
 856     county;
 857     
 858 select 
 859     concat(code, name),
 860     substr(name, 3, 2)
 861 from 
 862     country;
 863     
 864 -- 把国家的代码和名称及大洲用@符号连接. 如 : CHN@China@asia 
 865 select
 866     concat(concat(concat(concat(code, ‘@‘), name), ‘@‘), continent)
 867 from 
 868     country;
 869     
 870 select
 871     concat(code, ‘@‘, name, ‘@‘, continent)
 872 from 
 873     country;
 874 
 875 
 876 -- 分组函数 : 作用于一组数据. 默认情况下虚表中的所有记录被当作一个组.
 877 分组函数都是统计运算, 特点就是一组数据只能有一个结果. 结果也必须是所有数据处理完后才有的.
 878 
 879 max() 最大值 
 880 min() 最小值 
 881 avg() 平均值 
 882 sum() 求和
 883 count() 计数
 884 
 885 select 
 886     max(population),
 887     min(surfacearea)
 888 from 
 889     country ;
 890 
 891 
 892 select 
 893     -- name, 不可以再把普通的列放在这里
 894     max(name),
 895     max(population),
 896     min(surfacearea)
 897 from 
 898     country ;
 899 
 900 复习 :
 901 
 902 C / S 架构
 903 Server : mysqld 
 904 Client : mysql 
 905 
 906 客户端连接服务器必须要提供 : 主机地址, 端口号, 用户名, 密码, 默认数据库
 907 mysql --host=127.0.0.1 --port=3306 --user=root --password=123456 world
 908 
 909 -- 查看所有数据库
 910 show databases;
 911 
 912 -- 查看库中的表
 913 show tables;
 914 
 915 -- 查看其他库中的表
 916 show tables from 库名;
 917 
 918 -- 查看表结构 
 919 desc 表名;
 920 
 921 -- 查看表的建表语句
 922 show create table 表名;
 923 
 924 -- 通过建表语句可以看出表的存储引擎, 缺省字符集, 各种约束的名字....
 925 
 926 myisam引擎不支持高级特性 : 事务, 外键, 行级锁. 速度极快
 927 innodb引擎支持高级特性, 速度稍慢.
 928 
 929 ``的作用是专门用于包围数据库对象的名称. 
 930 数据库 
 931  932  933 索引 
 934 约束
 935 函数
 936 ......
 937 
 938 C : insert  
 939 R : select 
 940 U : update 
 941 D : delete 
 942 以上语句统称为DML -> 数据操纵语言 
 943 
 944 
 945 create 
 946 drop 
 947 alter
 948 以上语句统称DDL语句 -> 数据定义语言
 949 
 950 
 951 跨库操作表 : 只需要在表名上加上库.限定
 952 select * from company.employees;
 953 
 954 select 
 955     *
 956 from 
 957     country;
 958     
 959 使用用户变量
 960 set @var1 = 200;
 961 set @var1 = ‘abc‘;
 962 
 963 -- 查询没有首都和官方语言的国家
 964 select 
 965     100, -- 常量 
 966     ‘abc‘,
 967     20 + 30 / (50 - 3), -- 常量
 968     @var1, -- 用户变量
 969     @@datadir, -- 系统变量
 970     database(), -- 函数
 971     now(),
 972     co.*, -- 普通列
 973     ci.*,
 974     cl.*
 975 from 
 976     country co 
 977 left join 
 978     city ci 
 979 on 
 980     co.capital = ci.id -- 联接条件
 981 left join 
 982     countrylanguage cl 
 983 on 
 984         co.code = cl.countrycode 
 985     and 
 986         cl.isofficial = ‘t‘
 987 where 
 988         cl.language is null
 989     and 
 990         ci.name is null
 991 order by 
 992     co.name desc; 
 993 
 994     
 995 -- 查询亚洲国家的平均人口
 996 select 
 997     avg(population)
 998 from 
 999     country 
1000 where 
1001     continent = ‘asia‘;
1002 
1003 -- 查询全球平均寿命最高和最低
1004 select 
1005     max(LifeExpectancy),
1006     min(LifeExpectancy)
1007 from 
1008     country;
1009     
1010 max() 最大值 
1011 min() 最小值 
1012 avg() 平均值 
1013 sum() 求和
1014 count() 计数
1015 
1016 select 
1017     sum(population),
1018     count(capital)
1019 from 
1020     country;
1021     
1022 -- 查看表中的记录数
1023 select 
1024     count(*)
1025 from 
1026     country;
1027     
1028 -- 解决的问题类似于, 查看 各大洲 的情况.
1029 select 
1030     continent, -- 群体概念
1031     max(name),
1032     avg(surfacearea)
1033 from 
1034     country 
1035 group by 
1036     continent;
1037     
1038 -- 查看各地区的最大人口数
1039 select
1040     continent,
1041     region,
1042     max(population)
1043 from 
1044     country 
1045 group by 
1046     continent,
1047     region;
1048     
1049 select
1050     max(continent),
1051     region,
1052     max(population)
1053 from 
1054     country 
1055 group by 
1056     region
1057 order by 
1058     max(continent);
1059 
1060 
1061 -- 查看各国的城市总人口数
1062 select 
1063     countrycode,
1064     sum(population)
1065 from 
1066     city 
1067 group by 
1068     countrycode 
1069 
1070 select
1071     name,
1072     population,
1073     sum(surfacearea)
1074 from 
1075     country 
1076 group by 
1077     name,
1078     population;
1079     
1080 -- 对分组的结果进行过滤, 只能使用having    
1081 select 
1082     countrycode,
1083     sum(population) sumPop
1084 from 
1085     city 
1086 group by 
1087     countrycode 
1088 having
1089     sumPop > 10000000
1090 order by 
1091     sumPop;
1092 
1093 -- 查看亚洲国家各省城市总人口和城市个数中城市总人口数大于100万的.
1094 select 
1095     co.name,
1096     ci.district,
1097     sum(ci.population) sumPop,
1098     count(ci.id) cities
1099 from 
1100     country co 
1101 join 
1102     city ci 
1103 on 
1104     co.code = ci.countrycode 
1105 where 
1106     co.continent = ‘asia‘
1107 group by 
1108     co.name,
1109     ci.district
1110 having 
1111     sumPop > 1000000
1112 order by 
1113     cities desc;
1114     
1115 解决SQL步骤 :     
1116 1) 最基础的基表, from 
1117 2) 考虑一张表的数据够不够, 如果不够进行连接 join 
1118 3) 再考虑是外还是内, 如果是外还得考虑保证哪张表完整
1119 4) 有join必须要有on 
1120 5) 是否需要对当前的大基表进行基础的行过滤. where 
1121 6) 是否需要分组, 分组依据的列是什么. group by 
1122 7) 如果有分组,第一时间,把分组的列放在 select 后面, 并同时继续分析要选择哪些列或统计运算.
1123 8) 是否要再对分组结果进行进一步过滤, 如果需要使用having
1124 9) 是否需要排序, 如果需要使用order by .
1125 
1126 练习 : 
1127 1 列出所有在超过10个国家中使用的语言。
1128 select
1129     language,
1130     count(countrycode) ct
1131 from 
1132     countrylanguage
1133 group by 
1134     language 
1135 having 
1136     ct > 10;
1137     
1138 2 查询每个大洲各有多少种政府组织形式和每个大洲最富有的收入
1139 select 
1140     continent,
1141     count(distinct GovernmentForm),
1142     max(gnp)
1143 from 
1144     country 
1145 group by 
1146     continent;
1147     
1148     
1149 3 列出不同的国家(country code)有居民超过7,000,000的城市, 它们有多少?
1150 select 
1151     countrycode,
1152     count(*)
1153 from 
1154     city 
1155 where 
1156     population > 7000000 
1157 group by 
1158     countrycode;
1159     
1160 4 查询中国的每个省的总城市数量和总人口数
1161 -- 能用where解决 不要用having解决.
1162 select 
1163     district,
1164     count(*),
1165     sum(population)
1166 from 
1167     city 
1168 where 
1169     countrycode = ‘chn‘
1170 group by 
1171     district
1172 order by 
1173     sum(population) desc;
1174     
1175 
1176 select
1177     countrycode,
1178     district,
1179     count(*),
1180     sum(population)
1181 from 
1182     city 
1183 group by 
1184     countrycode,
1185     district
1186 having 
1187     countrycode = ‘chn‘
1188 order by 
1189     sum(population) desc;
1190     
1191 5 Sweden国家说的是什么语言?
1192 select 
1193     co.name,
1194     cl.language,
1195     cl.isofficial
1196 from 
1197     countrylanguage cl 
1198 join 
1199     country co 
1200 on 
1201     cl.countrycode = co.code 
1202 where 
1203     co.name = ‘sweden‘;
1204     
1205 6 哪些国家没有列出任何使用语言?
1206 select 
1207     co.name,
1208     cl.language
1209 from 
1210     countrylanguage cl 
1211 right join 
1212     country co 
1213 on 
1214     cl.countrycode = co.code 
1215 where 
1216     cl.language is null;
1217     
1218 select 
1219     co.name,
1220     count(cl.language) ct 
1221 from 
1222     countrylanguage cl 
1223 right join 
1224     country co 
1225 on 
1226     cl.countrycode = co.code 
1227 group by 
1228     co.name 
1229 having 
1230     ct = 0;
1231 
1232 
1233 7 列出在城市表中80%人口居住在城市的国家
1234 select 
1235     co.name,
1236     sum(ci.population) / co.population rate
1237 from 
1238     country co 
1239 join 
1240     city ci 
1241 on 
1242     co.code = ci.countrycode 
1243 group by
1244     co.population,
1245     co.name 
1246 having 
1247     rate > 0.8;
1248     
1249     
1250     
1251     
1252 -- 子查询 : 解决一次查询不能解决的问题.
1253 select 
1254     name,
1255     surfacearea,
1256     continent
1257 from 
1258     country 
1259 where surfacearea >
1260                     (select 
1261                         avg(surfacearea)
1262                     from 
1263                         country) 
1264     
1265 -- 子查询用在比较运算中时, 必须返回一行一列. 下面的SQL是错误的    
1266 select 
1267     name,
1268     surfacearea,
1269     continent
1270 from 
1271     country 
1272 where surfacearea >
1273                     (select 
1274                         avg(surfacearea)
1275                     from 
1276                         country
1277                     group by continent) 
1278                     
1279 -- 找出哪个城市的人口是最多的.
1280 select 
1281     countrycode,
1282     name,
1283     population
1284 from 
1285     city  
1286 where     
1287     population = (select max(population) from city);
1288     
1289 -- 找出平均寿命最高的和最低的国家.
1290 select 
1291     continent,
1292     name,
1293     lifeExpectancy
1294 from 
1295     country 
1296 where 
1297     lifeExpectancy in ( (select max(lifeExpectancy) from country),
1298                         (select min(lifeExpectancy) from country))
1299                         
1300 -- 查看哪些国家的人口是大于本大洲平均人口.
1301 select 
1302     co1.name,
1303     co1.continent,
1304     co1.population,
1305     co2.avgPop 
1306 from 
1307     country co1
1308 join 
1309     (select 
1310         continent,
1311         avg(population) avgPop
1312     from 
1313         country 
1314     group by 
1315         continent) co2
1316 on 
1317     co1.continent = co2.continent
1318 where 
1319     co1.population > co2.avgPop
1320 order by  
1321     continent;
1322     
1323 -- 创建数据库
1324 create database if not exists school charset gbk;
1325 
1326 -- 修改数据库, 只能修改默认字符集
1327 alter database school charset utf8;
1328 
1329 -- 丢弃数据库
1330 drop database if exists school;
1331 
1332 -- 切换数据库
1333 use school;
1334 
1335 
1336 数据类型
1337 int                4字节整数
1338 bigint            8字节整数
1339 char(长度)        定长字符串, 长度最大255, 在实际插入数据时, 如果长度不够, 会自动补齐.
1340 varchar(长度)    变长字符串, 长度最大65535字节, 在实际插入数据时, 如果长度不够, 实际多少就占多少空间.
1341 longtext        超长文本
1342 double            8字节浮点数
1343 decimal            多字节定点数
1344 date            日期
1345 time            时间
1346 datetime        日期时间
1347 timestamp        时间戳
1348 
1349 -- 创建表, 必须至少要有一个列
1350 -- 主键 : 数据必须是非空且唯一.
1351 create table if not exists teacher(
1352     id int auto_increment, -- 将来这个列对应的数据可以自动生成. 必须作成主键
1353     name varchar(20), -- varchar数据类型必须要有长度.
1354     age int,
1355     salary double,
1356     gender enum(‘男‘, ‘女‘) default ‘男‘,
1357     primary key(id) -- 表级主键
1358 ) engine innodb charset utf8; -- 
1359 
1360 create table if not exists classes(
1361     id int auto_increment,
1362     name varchar(20) not null, -- not null 就是非空
1363     room char(3),
1364     begindate date,
1365     master int, --班主任是一个整数, 将来是某个老师的id 
1366     primary key(id)
1367 );
1368 
1369 -- 创建学生表, id, name, age, gender, phone, class_id
1370 create table if not exists student (
1371     id int auto_increment,
1372     name varchar(20),
1373     age int,
1374     gender enum(‘男‘, ‘女‘) default ‘男‘,
1375     phone varchar(15),
1376     class_id int,
1377     primary key(id)
1378 );
1379 
1380 insert into teacher(
1381     name,
1382     age,
1383     salary,
1384     gender
1385 ) values (
1386     ‘佟刚‘,
1387     40,
1388     2000,
1389     ‘男‘
1390 );
1391 
1392 insert into teacher(
1393     id,
1394     name,
1395     age,
1396     salary,
1397     gender
1398 ) values (
1399     null,
1400     ‘芳芳‘,
1401     20,
1402     50000,
1403     ‘女‘
1404 );
1405 
1406 
1407 -- 基于子查询建表, 把虚表变成实表
1408 create table country2
1409 as select * from world.country; -- 复制表, 只是机械的把虚表变实, 不能复制约束(主键)
1410 
1411 -- 复制表结构建表, 没有数据
1412 create table country3 
1413 like world.country;
1414 
1415 
1416 +----------+-----------------+------+-----+---------+----------------+
1417 | Field    | Type            | Null | Key | Default | Extra          |
1418 +----------+-----------------+------+-----+---------+----------------+
1419 | id       | int(11)         | NO   | PRI | NULL    | auto_increment |
1420 | name     | varchar(20)     | YES  |     | NULL    |                |
1421 | age      | int(11)         | YES  |     | NULL    |                |
1422 | gender   | enum(‘男‘,‘女‘) | YES  |     | 男      |                |
1423 | phone    | varchar(15)     | YES  |     | NULL    |                |
1424 | class_id | int(11)         | YES  |     | NULL    |                |
1425 +----------+-----------------+------+-----+---------+----------------+
1426 
1427 insert into student(
1428     name,
1429     age,
1430     phone,
1431     class_id,
1432     address 
1433 ) values(
1434     ‘小明‘,
1435     20,
1436     ‘2342342‘,
1437     1,
1438     ‘北京昌平‘
1439 );
1440 
1441 -- 修改表
1442 alter table 表名 
1443 -- 支持若干子名
1444 
1445 -- 添加新列
1446 add column 新列名 数据类型(长度) 其他选项.
1447 
1448 alter table student 
1449 add column address varchar(200) not null; -- 新列追加在所有列的最后.
1450 
1451 alter table student 
1452 add column email varchar(50) after age; -- 在指定列后面添加新列
1453 
1454 alter table student 
1455 add column cardNo char(18) first; -- 在最前面添加新列
1456 
1457 -- 修改列, 数据类型, 长度, 其他选项 
1458 modify 列名 新数据类型(新长度) 新其他选项
1459 
1460 alter table student 
1461 modify name varchar(10) not null;
1462 
1463 -- 重命名列
1464 change 列名 新列名 新数据类型(新长度) 新其他选项;
1465 
1466 alter table student 
1467 change phone mobile char(11) unique; -- unique就是唯一.
1468 
1469 -- 丢弃列
1470 drop column 列名; -- 会导致删除的列所对应的所有数据全部丢失, 无法找回
1471 
1472 alter table student
1473 drop column cardNo;
1474 
1475 -- 重新命名表
1476 rename to 新表名
1477 
1478 alter table student 
1479 rename to students;
1480 
1481 alter table teacher 
1482 rename to teachers;
1483 
1484 -- 修改约束
1485 以上都是alter table 的子句, 用于修改表
1486 ---------------------------------------------------------------
1487 
1488 -- 丢弃表 操作很危险, 如果没有数据备份, 就永远找不回来.
1489 drop table 表名;
1490 
1491 -- 丢弃表时可以批量丢弃
1492 drop table country2, country3;
1493 
1494 -- 清空表 DDL, 表中数据不能恢复. 效率高
1495 truncate table 表名;
1496 
1497 delete 是DML, 是可以后悔的. 效率低.
1498 
1499 
1500 insert into teachers(
1501     name,
1502     age,
1503     salary,
1504     gender
1505 ) values (
1506     ‘红康‘,
1507     30,
1508     3000,
1509     ‘男‘
1510 );
1511 
1512 insert into teachers(
1513     name,
1514     age,
1515     salary,
1516     gender
1517 ) value (
1518     ‘小柴‘,
1519     20,
1520     5000,
1521     ‘女‘
1522 );
1523 
1524 insert into teachers(
1525     name,
1526     age,
1527     salary,
1528     gender
1529 ) values (
1530     ‘贺飞‘,
1531     35,
1532     4000,
1533     ‘男‘
1534 ), (
1535     ‘老韩‘,
1536     40,
1537     3000,
1538     ‘男‘
1539 ), (
1540     ‘安妮‘,
1541     32,
1542     6000,
1543     ‘女‘
1544 );
1545 
1546 -- 不建议这样的写法. 因为它强烈依赖表的结构,如果表的结构发生变化, 下面的语句就容易失败!
1547 insert into teachers values(
1548     null,
1549     ‘小邱‘,
1550     40,
1551     7000,
1552     ‘男‘
1553 );
1554 
1555 +-----------+-------------+------+-----+---------+----------------+
1556 | Field     | Type        | Null | Key | Default | Extra          |
1557 +-----------+-------------+------+-----+---------+----------------+
1558 | id        | int(11)     | NO   | PRI | NULL    | auto_increment |
1559 | name      | varchar(20) | NO   |     | NULL    |                |
1560 | room      | char(3)     | YES  |     | NULL    |                |
1561 | begindate | date        | YES  |     | NULL    |                |
1562 | master    | int(11)     | YES  |     | NULL    |                |
1563 +-----------+-------------+------+-----+---------+----------------+
1564 
1565 insert into classes (
1566     name,
1567     room,
1568     begindate,
1569     master 
1570 ) values (
1571     ‘Java0725‘,
1572     ‘305‘,
1573     now(), -- 值的部分可以使用函数调用
1574     2
1575 );
1576 
1577 -- 实现表的完全克隆!!!
1578 create table if not exists country2 like world.country;
1579 
1580 -- 基于子查询插入数据, 好处就是一次性插入多条记录.
1581 insert into country2 
1582 select * from world.country;
1583 
1584 
1585 -- 事务 : 一组DML, 在执行时, 要么全部失败, 要么全部成功, 使得数据从一种状态转换为另一种状态. 数据没有丢失!!
1586 
1587 A Atomic 原子性             所有操作不可分割.
1588 C Consistence 一致性        数据在事务前和事务后数据是一致的.
1589 I ISOLATION    独立性             不同事务之间具有隔离性
1590 D Duration    持久性            事务一旦提交, 永久生效.
1591 
1592 DCL : 数据控制语言 : commit, rollback, grant, revoke...
1593 
1594 显式启动事务 : 
1595     set autocommit = false;
1596     set @@autocommit = off;
1597     
1598     多条DML语句;
1599     
1600     commit; 事务提交, 成功
1601     rollback; 事务回滚, 失败
1602     ddl语句执行 : 事务提交
1603     会话正常结束 提交
1604     异常结束 : 回滚
1605     
1606     
1607     还原设置
1608     set autocommit = true;
1609     set @@autocommit = on;
1610 
1611 
1612     
1613     

 

以上是关于大数据第24天-子查询-杨大伟的主要内容,如果未能解决你的问题,请参考以下文章

跟着大伟学SQL:从基础到进阶,从刷题到面试

2018年最新大数据24期实战项目 9天 附课件源码

第24天SQL进阶-查询优化- performance_schema系列实战一:利用等待事件排查MySQL性能问题(SQL 小虚竹)

第24天SQL进阶-查询优化- performance_schema系列实战一:利用等待事件排查MySQL性能问题(SQL 小虚竹)

第24天SQL进阶-查询优化- performance_schema系列实战一:利用等待事件排查MySQL性能问题(SQL 小虚竹)

第24天SQL进阶-查询优化- performance_schema系列实战一:利用等待事件排查MySQL性能问题(SQL 小虚竹)