목록DB (13)
without haste but without rest
빅데이터를 지탱하는 기술 277~278p Redshift, BigQuery는 데이터 웨어하우스를 위한 클라우드 서비스로 자주 비교되는데, 이 둘의 구조는 완전히 다르다. 가장 큰 차이점은 Redshift가 전용 리소스(dedicated resource)인 것에 비해 BigQuery는 공유 리소스(shared resource)라는 점이다. Redshift는 전통적인 MPP 데이터베이스의 흐름을 이어 왔기에 스토리지와 계산 노드가 일체화된 환경에서 효율적으로 쿼리를 실행하게 되어 있다. Redshift 자원이 전용이라 다른 사용자가 사용할 수 없기 때문에 성능이 안정적이다. 또한, 노드 수를 늘리면 스토리지 용량과 계산 능력이 모두 증가하므로, 데이터 양에 대해 일정한 성능이 유지된다. BigQuery 수천..
1. EUQI JOIN 두 테이블 간 속성 값들이 정확히 일치하는 경우다. 두 테이블에서 다른 값들이 존재하는 경우? 아래 이미지에서 TAB1 과 TAB2는 서로 상대방이 가지고 있지 않은 속성값들을 가지고 있다. 2. INNER JOIN 이너 조인을 실행하면 공통 데이터가 B와 C이므로 2건을 출력한다. 3. OUTER JOIN (1). RIGHT OUTER JOIN 라이트 아우터 조인을 실행하면 A, B, C 3건이 출력되고 A는 NULL값으로 연결 (2) LEFT OUTER JOIN 레프트 아우터 조인은 B, C, D, E가 출력된다. D, E는 NULL값으로 연결 (3) FULL OUTER JOIN 풀 아우터 조인을 실행하면 A, B, C, D, E 모두 출력하며 A, D, E는 NULL과 연결된다.
1. WHERE SELECT [DISTINCT/ALL] 칼럼명 [ALIAS명] FROM 테이블명 WHERE 조건식; ex) 수량 > 10 2. GROUP BY SELECT 칼럼명 FROM 테이블명 [WHERE 조건식] [GROUP BY 칼럼이나 표현식] [HAVING 그룹조건식] ; ex) GROUP BY 학점 -> 학점 컬럼에서 동일한 속성으로 묶어서 적용 where절은 해당 컬럼에 조건을, group by절은 컬럼을 정해서 그룹별로 묶음 3. HAVING SELECT [DISTINCT/ALL] FROM 테이블 GROUP BY POSITION HAVING AVG(HEIGHT) >= 180; * where절은 개별 행에 조건절이 먼저 적용, having절은 그룹의 결과 집합에 조건이 적용 4. ORDER..
1. GRANT - 권한 부여 ex) GRANT ALL PRIVILEGES ON *.* TO 유저이름 IDENTIFIED BY '권한 부여자' 2. REVOKE ex) REVOEK ALL ON *.* FROM 유저이름
1. COMMIT DML 명령어 실행 후 COMMIT 해줘야 적용 완료 ex) DELETE FROM 테이블명; COMMIT; 2. ROLEBACK DML 명령어 실행 후 ROLEBACK시 명령 취소 ex) DELETE FROM 테이블명; ROLLBACK; 3. SAVEPOINT 세이브 포인트를 지정한다. 롤백시 해당 시점으로 롤백한다. 단 A지점으로 돌리면 B로 갈 수 없다.
1. INSERT ex) INSERT INTO 테이블명 ('데이터1', '데이터2 ', '데이터3 '); 2. UPDATE ex) UPDATE 테이블명 SET 컬럼명 = '수정 사항' 3. DELETE ex) DELETE FROM 테이블명 4. SELECT ex) SELECT 컬럼명, 컬럼명, .... FROM 테이블명 DDL은 오토 커밋으로 즉시 완료 DML은 커밋을 수동으로 해줘야한다.
1. CREATE TABLE - 테이블 생성 2. ALTER TABLE - 컬럼 옵션 ADD COLUMN DROP COLUMN MODIFY COLUMN 3. RENAME TABLE - 테이블 리네임 4. DROP TABLE - 테이블 삭제 5. TRUNCATE TABLE - 구성 요소 삭제 테이블 자체를 삭제하지 않고, 구성 요소를 제거해서 저장 공간을 재사용