Phần tiếp theo khi bắt đầu cùng với Power BI Desktop, sau định hình dữ liệu, bài viết này sẽ chỉ cho các bạn cách kết hợp dữ liệu và tại sao nên kết hợp dữ liệu.
Kết hợp dữ liệu
Dữ liệu về các trạng thái khác nhau rất thú vị và sẽ hữu ích cho việc xây dựng các nỗ lực phân tích và truy vấn bổ sung. Nhưng có một vấn đề của: hầu hết các dữ liệu ngoài đó sử dụng chữ viết tắt hai chữ cái cho mã trạng thái, không phải tên đầy đủ của trạng thái. Chúng ta cần một số cách để liên kết tên trạng thái với chữ viết tắt của chúng.
Chúng ta rất may mắn: có một nguồn dữ liệu công khai khác. Ở đây, tài nguyên Web cho các chữ viết tắt của tiểu bang:
http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations
Từ Home trong Query Editor, chúng ta chọn Get Data > Web và nhập địa chỉ, chọn OK và cửa sổ Navigator hiển thị những gì tìm thấy trên trang Web đó.

Chúng ta chọn Table[edit] vì nó bao gồm dữ liệu chúng ta muốn, nhưng nó sẽ mất đi hình dạnh trước đó để giảm bớt dữ liệu bảng đó xuống. Dưới đây là tóm tắt các bước thực hiện:
Chúng ta chọn Edit, sau đó:
- Xóa hai hàng trên cùng – chúng là kết quả của cách mà bảng trên trang Web được tạo và chúng ta không cần chúng.
- Xóa 26 hàng dưới cùng – chúng là tất cả những phần mà chúng ta không cần bao hàm.
- Lọc và loại ra Washington DC – bảng thống kê nghỉ hưu không bao gồm DC, vì vậy chúng ta sẽ loại trừ nó khỏi danh sách của chúng ta.
- Xóa một vài cột không cần thiết – chúng ta chỉ cần ánh xạ trạng thái sang chữ viết tắt hai chữ cái chính thức của nó, vì vậy chúng ta có thể xóa các cột khác.
- Sử dụng hàng đầu tiên làm tiêu đề – vì chúng ta đã xóa ba hàng trên cùng, hàng trên cùng hiện tại là tiêu đề mà chúng ta muốn.
Chú ý: Đây là thời điểm tốt để chỉ ra cho những người mới bắt đầu cùng với Power BI Desktop biết rằng chuỗi các bước được áp dụng trong Query Editor rất quan trọng và có thể ảnh hưởng đến cách dữ liệu được định hình. Nó cũng quan trọng để xem xét làm thế nào một bước có thể tác động đến một bước tiếp theo; nếu bạn loại bỏ một bước khỏi Applied Steps, các bước tiếp theo có thể không hoạt động như dự định ban đầu, do tác động của chuỗi các bước truy vấn.
- Đổi tên các cột và chính bảng – như thường lệ, có một vài cách để đổi tên cột, bạn có thể chọn bất kỳ cách nào bạn thích.
Với bảng StateCodes đã được định hình, chúng ta có thể kết hợp hai bảng hoặc truy vấn này thành một; vì các bảng mà chúng ta hiện có là kết quả của các truy vấn mà chúng ta đã áp dụng cho dữ liệu, nên chúng thường được gọi là các truy vấn.
Có hai cách chính để kết hợp truy vấn – merging (hợp nhất) và appending (nối thêm).
Khi bạn có một hoặc nhiều cột mà bạn muốn thêm vào một truy vấn khác, bạn merge (hợp nhất) các truy vấn. Khi bạn có thêm các hàng dữ liệu mà bạn muốn thêm vào một truy vấn hiện có, bạn sẽ append (nối thêm) truy vấn đó.
Trong trường hợp này, chúng ta muốn hợp nhất các truy vấn. Để bắt đầu, chúng ta chọn truy vấn mà chúng ta muốn truy vấn khác hợp nhất, sau đó chọn Merge Queries từ tab Home.

Cửa sổ Merge xuất hiện, nhắc chúng ta chọn bảng mà chúng ta muốn sáp nhập vào bảng đã chọn và sau đó các cột phù hợp sẽ sử dụng để hợp nhất. Chọn State từ bảng RetirementStats (truy vấn), sau đó chọn truy vấn StateCodes (đơn giản trong trường hợp này, vì chỉ có một truy vấn khác – khi bạn kết nối với nhiều nguồn dữ liệu thì sẽ có nhiều truy vấn để chọn). Khi chúng ta chọn các cột khớp phù hợp – State từ RetirementStats và Tên trạng thái từ StateCodes – cửa sổ Merge trông giống như sau và nút OK được bật.

Một NewColumn được tạo ở cuối truy vấn, đó là nội dung của bảng (truy vấn) đã được hợp nhất với truy vấn hiện có. Tất cả các cột từ truy vấn đã hợp nhất được cô đọng vào NewColumn, nhưng bạn có thể chọn Expand (mở rộng bảng) và bao gồm bất kỳ cột nào bạn muốn. Để mở rộng bảng đã hợp nhất và chọn các cột sẽ bao gồm, chọn biểu tượng mở rộng ngay trỏ chuột ở hình dưới. Cửa sổ Expand xuất hiện.

Trong trường hợp này, chúng ta chỉ muốn cột State Code, vì vậy chúng ta chỉ chọn cột đó và sau đó chọn OK. Chúng ta bỏ tuýt khỏi phần Use original column name as prefix (Sử dụng tên cột ban đầu làm tiền tố) vì chúng ta không cần hoặc muốn điều đó; nếu chúng ta chọn lựa đó, cột được hợp nhất sẽ được đặt tên là NewColumn.State Code (tên cột ban đầu hoặc NewColumn, sau đó là một dấu chấm, sau đó là tên của cột được đưa vào truy vấn).
Chú ý:Bạn có thể muốn thử nhiều cách như cách tuýt thêm vào bảng NewColumn đó? Bạn có thể thử nghiệm một chút và nếu bạn không thích kết quả, chỉ cần xóa bước đó khỏi danh sách Applied Steps trong ngăn Query Settings; truy vấn của bạn trở về trạng thái trước khi áp dụng bước Expand đó. Bạn có thể làm bao nhiêu lần tùy thích cho đến khi quá trình mở rộng diễn ra theo cách bạn muốn.
Bây giờ chúng ta có một truy vấn duy nhất (table) kết hợp hai nguồn dữ liệu, mỗi nguồn được định hình để đáp ứng nhu cầu của chúng ta. Truy vấn này có thể làm cơ sở cho rất nhiều kết nối dữ liệu bổ sung, thú vị – chẳng hạn như thống kê chi phí nhà ở, nhân khẩu học hoặc cơ hội việc làm ở bất kỳ tiểu bang nào.
Hiện tại, chúng ta có đủ dữ liệu để tạo một vài báo cáo thú vị, tất cả trong Power BI Desktop. Vì đây là một cột mốc quan trọng, nên hãy lưu tập tin Power BI Desktop này – chúng ta sẽ gọi nó là Getting Started with Power BI Desktop (Bắt đầu với Power BI Desktop). Để áp dụng các thay đổi trong Query Editor và tải chúng vào Power BI Desktop, chọn Close & Apply từ thanh công cụ Home.

Trên đây là toàn bộ về việc kết hợp dữ liệu, một phần rất quan trọng mà những người mới bắt đầu cùng với Power BI Desktop cần chú ý để có được dữ liệu hoàn chỉnh cho báo cáo của mình. Phần tiếp theo là xây dựng Báo cáo sẽ được chia sẻ trong bài viết Bắt đầu cùng Power BI Desktop p4.