intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Cơ sở dữ liệu đa phương tiện: Chương 2 - Nguyễn Thị Oanh

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:71

32
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Cơ sở dữ liệu đa phương tiện - Chương 2: Truy nhập dữ liệu đa phương tiện" cung cấp cho người học các kiến thức: Truy nhập dữ liệu đa phương tiện từ đĩa từ, truy nhập dữ liệu từ CD-ROM,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Cơ sở dữ liệu đa phương tiện: Chương 2 - Nguyễn Thị Oanh

  1. Chương 2: Truy nhập dữ liệu đa phương tiện Nguyễn Thị Oanh Bộ môn HTTT – Viện CNTT & TT oanhnt@soict.hut.edu.vn 1
  2. Đặt vấn đề  Youtube: – 2009: over 1 billion videos per day – Bandwidth accounts for about 51% of expenses -- with a run rate of $1 million per day -- with content licensing accounting for 36% http://www.wired.com/epicenter/2009/10/youtube-over-one-billion-videos-served-per-day/ http://www.multichannel.com/article/191223- 2 YouTube_May_Lose_470_Million_In_2009_Analysts.php
  3. Đặt vấn đề  YouTube Video Server (2010): – May 2010, 2 Billion videos served per day – More than 24 hours of video uploaded every minute (and +) (2011: 48h /minute) – Videos usually less than 10 minutes long – Top videos ("Evolution of Dance", "Charlie Bit My Finger", and Lady Gaga's "Bad Romance“) are approaching 200 million views  http://tech.fortune.cnn.com/2010/05/17/youtube-at-5-years-old-2- billion-served-per-day/ 3
  4. Đặt vấn đề  Dailymotion: – Dailymotion is the second largest video site in the world after YouTube – 29th most visited website in the world – 114 millions unique visitors and more than 1,2 billions video views every month (Comscore, 5/2011) 4
  5. Đặt vấn đề  Dành cho dữ liệu động, DL có thông số thời gian – Audio – Video  DL đòi hỏi tính liên tục (continuous) được đảm bảo  DL tĩnh: – Các phương pháp biểu diễn DL đa chiều: B-tree, R-tree, … 5
  6. 1. Truy nhập dữ liệu đa phương tiện từ đĩa từ 6
  7. Nhắc lại: cấu trúc đĩa từ  Nhiều đĩa phẳng (platters), xếp đồng trục trên 1 trục chính (spindle)  Các cần di chuyển đầu đọc/ghi được gắn chung trên 1 trục quay  Mỗi mặt đĩa có 1 đầu đọc/ghi 7
  8. Cấu trúc đĩa từ  Track (A): – Nơi chứa DL – Vòng tròn đồng tâm trên các mặt đĩa  Region (B): – Mỗi mặt đĩa được chia thành k vùng đều nhau  Sector (C): – Là phần giao của mỗi track và region  Cluster (D): tập các sector  Cylinder: 8 – Tập các tracks có cùng bán kính trên tất cả các mặt đĩa
  9. Truy nhập đĩa từ  2 bước: – phép dịch (seek operations): tìm đến track có chứa địa chỉ cần tìm kiếm  seek time  tăng tốc (acceleration phase)  chạy ổn định (coast phase)  giảm tốc độ (deceleration phase)  ổn định vị trí (settle phase) – phép quay (rotational operations) rotational latency (spin time) Thời gian = tgian dịch + tgian quay + tgian đọc DL 9
  10. Truy nhập đĩa từ  Transfer rate (bandwidth) (TR): – MB/s – Tốc độ ghi và đọc thường khác nhau – Thường TR được ngầm hiểu là tốc độ đọc, còn tốc độ ghi thì thường được chỉ rõ  Vận tốc góc: – hầu hết các đĩa có vận tốc góc quay không đổi (constant angular veolocity - CAV) – Thời gian chuyển từ sector x -> sector y là giống nhau trên tất cả các track 10
  11. Truy nhập đĩa từ Ký hiệu Ý nghĩa tj , j Vị trí đầu đọc hiện tại: sector j, track tj ti, i Vị trí DL sẽ được đọc: sector i, track ti rd mật độ dữ liệu (MB/sector) dtr tốc độ đọc DL (MB/giây) rv vận tốc dịch trung bình của cần di chuyển đầu đọc/ghi rnum số vùng trên mỗi mặt đĩa ss tốc độ quay (độ / phút) 11
  12. Thời gian đọc DL rd readtime(i, j )  Sk (ti , t j )  spin _ time(i, j )  dtr abs(ti  t j ) Sk (ti , t j )  rv spin _ time(i, j )  abs(i  j ) mod rnum  360 1  rnum ss 12
  13. Phương pháp lưu trữ phổ biến  RAID: Redundant Array of Inexpensive Disks – RAID-0 – RAID-1 – RAID-5 – RAID-2, RAID-3, RAID-4, RAID0+1, RAID1+0, …  Nguyên tắc: ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng – gia tăng tốc độ đọc/ghi dữ liệu – hoặc/và nhằm tăng thêm sự an toàn của dữ liệu  Khái niệm: 13 – block: khối DL nhỏ nhất được quan tâm khi đọc, ghi
  14. RAID-0 – 1 đĩa điều khiển + n đĩa dữ liệu (0, 1,…, n-1), n >= 2 – Sử dụng kỹ thuật phân chia (striping): chia dữ liệu thành các phần bằng nhau đặt trên nhiều đĩa và không có sự lặp lại DL – k-stripe: (k
  15. RAID-0 – Movie 1: blocks: b0, b1, b2, b3, b4 với k = 3 bắt đầu từ đĩa 0 – Movie 2: blocks: c0, c1, c2, c3, c4, c5 với k = 4 bắt đầu từ đĩa 1 – Tổng quát: các block liên tiếp b0, b1, b2, ..., br-1 lưu trữ trong RAID 0 với nhóm k đĩa bắt đầu ở đĩa j 15  block bi sẽ được lưu vào đĩa (i+j) mod k
  16. RAID-0  Ưu điểm: – Tốc độ đọc dữ liệu ra tăng lên do có thể đọc đồng thời từ k đĩa, tuy nhiên có giới hạn, phụ thuộc vào:  Kích thước bộ đệm  Độ rộng băng thông của đường bus cho thiết bị ra  Nhược điểm – Không đảm bảo tính tin cậy: nếu 1 đĩa hỏng  mất dữ liệu và ảnh hưởng toàn bộ hệ thống 16
  17. RAID-1  Sử dụng khái niệm đối xứng (mirroring): – Mỗi đĩa có 1 đĩa đối xứng – Nếu có N đĩa có thể sử dụng  chỉ có n = N/2 đĩa được sử dụng đồng thời. – Striping có thể được sử dụng cho n đĩa này  Ghi: ghi đồng thời lên đĩa chính + đĩa đối xứng  Đọc: từ đĩa chính hoặc từ đĩa đối xứng nếu đĩa chính hỏng  Ưu: tăng độ an toàn, tin cậy về DL  Nhược: tốn không gian lưu trữ (hiệu suất sử dụng:50%) 17
  18. RAID-1 RAID-1 + striping 18
  19. RAID-5  RAID-5: striping + parity checking – Cân đối được không gian lưu trữ và sự an toàn của DL  Mỗi nhóm k đĩa (cluster) sẽ có 1 đĩa parity giúp kiểm tra và phục hồi DL nếu 1 đĩa trong nhóm bị hỏng Ví dụ n=k = 4 19
  20. RAID-5  Giả sử – k = n đĩa (1 cluster), các đĩa được gán nhãn: 0, 1, 2, ..., n-1 – khối DL được lưu trong (n-1) đĩa, đĩa parity sẽ được xác định từ DL trong (n-1) đĩa  giả sử đĩa parity là đĩa thứ n-1  Di.j: dữ liệu bít thứ j của đĩa i  : phép hoặc loại trừ (exclusive-or)  Dn1. j  D0 . j  D1. j  ...  Dn2 . j 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2