Diễn đàn thiết kế kho dữ liệu

Mẹo thiết kế # 1: Cái nhìn khác về Degenerate Dimensions

Chúng tôi thường được hỏi về các Degenerate Dimensions trong các hội thảo mô hình của chúng tôi. Degenerate Dimensions gây ra nhầm lẫn vì chúng trông không giống hoặc cảm thấy như kích thước bình thường. Thật hữu ích khi nhớ rằng theo Webster, “thoái hóa” đề cập đến thứ gì đó 1) bị từ chối so với tiêu chuẩn tiêu chuẩn, hoặc 2) đơn giản hơn về mặt toán học.

Degenerate Dimensions (DD) là gì?

Hoạt động như một khóa thứ nguyên trong bảng dữ kiện, tuy nhiên không tham gia vào bảng thứ nguyên tương ứng vì tất cả các thuộc tính thú vị của nó đã được đặt trong các thứ nguyên phân tích khác. Đôi khi mọi người muốn đề cập đến cácDegenerate Dimensions dưới dạng dữ kiện văn bản, tuy nhiên chúng không phải là dữ kiện vì khóa chính của bảng dữ kiện thường bao gồm DD kết hợp với một hoặc nhiều khóa ngoại thứ nguyên bổ sung.

Degeneerate dimension

Degenerate Dimensions thường xảy ra khi hạt của bảng dữ kiện là một giao dịch (hoặc dòng giao dịch). Số tiêu đề kiểm soát giao dịch được chỉ định bởi quy trình nghiệp vụ hoạt động thường là các thứ nguyên thoái hóa, chẳng hạn như số đơn đặt hàng, vé, giao dịch thẻ tín dụng hoặc séc. Các Degenerate Dimensions này là khóa tự nhiên của “cha mẹ” của mục hàng.

Mặc dù không có bảng thứ nguyên tương ứng của các thuộc tính, nhưng Degenerate Dimensions có thể khá hữu ích để nhóm các hàng trong bảng dữ kiện có liên quan lại với nhau. Ví dụ: số giao dịch tại điểm bán lẻ liên kết tất cả các mặt hàng riêng lẻ được mua với nhau vào một giỏ thị trường duy nhất. Trong lĩnh vực chăm sóc sức khỏe, các thứ nguyên thoái hóa có thể nhóm các mục xác nhận quyền sở hữu liên quan đến một lần nằm viện hoặc một
đợt chăm sóc.

Đôi khi chúng ta gặp nhiều hơn một DD trong một bảng dữ kiện. Ví dụ: bảng thông tin về dòng yêu cầu bảo hiểm thường bao gồm cả số yêu cầu và số đơn bảo hiểm dưới dạng các thứ nguyên giảm dần. Một nhà sản xuất có thể bao gồm các kích thước thay đổi cho số báo giá, đơn đặt hàng và vận đơn trong bảng thông tin lô hàng.

Vai trò của Degenerate Dimensions

Kích thước thoái hóa cũng đóng vai trò như một sợi dây liên kết hữu ích với thế giới hoạt động. Điều này có thể đặc biệt hữu ích trong quá trình phát triển hệ thống dữ liệu để điều chỉnh các hàng của bảng dữ liệu với hệ thống hoạt động nhằm đảm bảo chất lượng và kiểm tra tính toàn vẹn.

Chúng tôi thường không triển khai khóa thay thế cho DD. Thông thường các giá trị cho Degenerate Dimensions là duy nhất và có kích thước hợp lý; họ không đảm bảo việc chỉ định khóa thay thế. Tuy nhiên, nếu mã định danh hoạt động là một chữ cái-số khó sử dụng, thì một khóa thay thế có thể tiết kiệm không gian đáng kể, đặc biệt nếu bảng dữ kiện có nhiều hàng. Tương tự như vậy, khóa đại diện là cần thiết nếu ID hoạt động không phải là duy nhất theo thời gian hoặc cơ sở vật chất. Tất nhiên, nếu bạn nối khóa thay thế này vào một bảng thứ nguyên, thì thứ nguyên đó không còn suy biến nữa.

Trong quá trình đánh giá thiết kế, đôi khi chúng tôi nhận thấy bảng kích thước phát triển tương xứng với bảng dữ kiện. Khi các hàng được chèn vào bảng dữ kiện, các hàng mới cũng được chèn vào bảng thứ nguyên có liên quan, thường ở cùng tỷ lệ với các hàng được thêm vào bảng dữ kiện. Tình hình này nên gửi một lá cờ đỏ vẫy. Thông thường, khi một bảng thứ nguyên đang phát triển với tốc độ gần giống như bảng dữ kiện, thì có một thứ nguyên bị suy giảm ẩn nấp đã bị bỏ qua trong thiết kế ban đầu.

>> Xem thêm bản gốc: Design tip 1