Bài viết được tổng hợp dưới đây thể hiện quan điểm, nhận định riêng của tác giả, không đại diện cho bất kì tổ chức, cá nhân nào khác. 

Phân tích dữ liệu hiệu quả là một yêu cầu của kinh doanh kỹ thuật số – và tất cả bắt đầu với các thực hành quản trị dữ liệu thông minh, nhấn mạnh vào chất lượng và ngữ cảnh.

Các giám đốc điều hành nói về giá trị của dữ liệu nói chung, nhưng Michele Koch, giám đốc tình báo dữ liệu doanh nghiệp tại Navient Solutions, có thể tính toán giá trị thực tế của dữ liệu của công ty mình.

Trên thực tế, Koch có thể thực sự tính bằng đô la, doanh thu tăng và chi phí giảm bởi các thành tố dữ liệu khác nhau của công ty. Kết quả là, cô ấy nhận thức rõ ràng rằng các vấn đề dữ liệu của Navient có thể làm tổn thương lợi nhuận của nó. Một sai lầm trong một trường dữ liệu quan trọng trong hồ sơ của khách hàng, ví dụ, có thể có nghĩa là công ty không thể xử lý một khoản vay với chi phí thấp nhất.

“Có tiền liên quan ở đây, vì vậy chúng tôi có một bảng điều khiển chất lượng dữ liệu, nơi chúng tôi theo dõi tất cả điều này. Chúng tôi theo dõi giá trị thực tế và tiềm năng, ”cô nói.

Barbara Deemer, giám đốc quản lý dữ liệu và phó chủ tịch tài chính cho biết, một sáng kiến ​​liên quan đến dữ liệu gần đây tại Navient, một công ty quản lý tài sản và dịch vụ xử lý kinh doanh có trụ sở tại Wilmington, Del. Sáng kiến ​​năm 2006 tập trung vào việc cải thiện chất lượng dữ liệu cho tiếp thị và mang lại ROI $ 7,2 triệu, với lợi nhuận thu được từ khoản vay tăng và giảm chi phí hoạt động.

Từ đó, các giám đốc điều hành của Navient đã cam kết hỗ trợ một chương trình quản trị dữ liệu mạnh mẽ như một phần quan trọng trong nỗ lực phân tích thành công. Chương trình quản trị của Navient bao gồm các tiêu chuẩn tốt nhất được công nhận từ lâu, chẳng hạn như chuẩn hóa các định nghĩa cho các trường dữ liệu và đảm bảo dữ liệu sạch.

Chương trình quản trị của Navient gán quyền sở hữu cho mỗi phần tử dữ liệu doanh nghiệp trong số khoảng khoảng 2.600 của nó; quyền sở hữu được chuyển đến khu vực kinh doanh nơi trường dữ liệu được bắt đầu lần đầu tiên hoặc khu vực kinh doanh nơi trường dữ liệu cụ thể không thể tách rời với các quy trình của nó.

Công ty cũng có một chương trình giám sát chất lượng dữ liệu để đảm bảo tiêu chuẩn cao được liên tục đáp ứng. Công ty cũng đã ra mắt Hội đồng quản trị dữ liệu (năm 2006) và Hội đồng quản trị dữ liệu Analytics (năm 2017) để giải quyết các câu hỏi hoặc mối quan tâm đang diễn ra, đưa ra quyết định trên toàn doanh nghiệp và liên tục cải thiện hoạt động dữ liệu cách thức cung cấp dữ liệu phân tích của công ty.

Koch nói: “Dữ liệu rất quan trọng đối với các sáng kiến ​​kinh doanh của chúng tôi và các cơ hội kinh doanh mới, nên chúng tôi muốn tập trung vào việc luôn cải thiện chất lượng dữ liệu hỗ trợ chương trình phân tích của chúng tôi”.

Hầu hết các nhà quản lý đều đồng ý rằng quản trị dữ liệu là rất quan trọng, dẫn đến sự tuân thủ, sự hài lòng của khách hàng và đưa ra quyết định tốt hơn, theo State of Data Governance năm 2018 từ công ty quản lý dữ liệu Erwin và UBM. Tuy nhiên, báo cáo cho thấy gần 40% các tổ chức ứng phó không có ngân sách riêng cho quản trị dữ liệu và 46% không có chiến lược chính thức cho nó.

Phát hiện này dựa trên phản hồi từ 118 người trả lời, bao gồm CIO, CTO, người quản lý trung tâm dữ liệu, nhân viên CNTT và tư vấn.

Với những con số đó, các chuyên gia cho rằng không có gì đáng ngạc nhiên khi có nhiều điểm yếu trong nhiều chương trình dữ liệu doanh nghiệp. Dưới đây là xem bảy thực hành dữ liệu có vấn đề như vậy

1. Đưa dữ liệu lại với nhau, nhưng không thực sự tích hợp dữ liệu

Tích hợp đứng đầu danh sách những thách thức trong thế giới dữ liệu và phân tích hiện nay, theo Anne Buff, phó chủ tịch truyền thông cho Tổ chức quản lý dữ liệu chuyên nghiệp.

Đúng vậy, nhiều tổ chức thu thập tất cả dữ liệu của họ ở một nơi. Nhưng trong thực tế họ không tích hợp các phần khác nhau từ nhiều nguồn dữ liệu, Buff giải thích. Vì vậy, dữ liệu của ông Bill Smith từ một hệ thống không kết nối với dữ liệu của Bill Smith (và các biến thể của tên của ông) được tạo ra bởi các hệ thống khác. Điều này mang lại cho nhiều doanh nghiệp hình ảnh không đầy đủ về ông ta.

Các công nghệ tích hợp dữ liệu khác nhau cho phép lựa chọn, triển khai và thực hiện đúng các công cụ là rất quan trọng để tránh làm quá nhiều công việc thủ công hoặc làm lại cùng một công việc.

Hơn nữa, tích hợp ngày càng trở nên quan trọng bởi vì các nhà khoa học dữ liệu đang tìm kiếm các mẫu trong dữ liệu để thu được loại thông tin chi tiết có thể mang lại những đột phá, lợi thế cạnh tranh.

Buff nói: “Nếu bạn không thể tập hợp những dữ liệu chưa bao giờ được đưa ra trước đây, bạn sẽ không thể tìm thấy những mẫu đó”.

2. Không nhận ra các đơn vị kinh doanh có nhu cầu riêng

Có, hợp nhất, dữ liệu tích hợp là rất quan trọng cho một chương trình phân tích thành công. Nhưng một số người dùng doanh nghiệp có thể cần một phiên bản khác của dữ liệu đó, Buff nói.

Dữ liệu trong một hình thức không đáp ứng nhu cầu cho tất cả mọi người trong tổ chức,” cô nói thêm.

Thay vào đó, CNTT cần phải suy nghĩ về cung cấp dữ liệu, tức là cung cấp dữ liệu cần thiết cho trường hợp kinh doanh được xác định bởi người dùng doanh nghiệp hoặc bộ phận kinh doanh.

Cô lấy ví dụ nhu cầu khác nhau của một tổ chức tài chính. Trong khi một số phòng ban có thể muốn dữ liệu tích hợp, bộ phận phát hiện gian lận có thể muốn các nhà khoa học dữ liệu của họ sử dụng dữ liệu không bị cố định không sạch sẽ để họ có thể tìm kiếm dấu hiệu khả nghi. Họ có thể muốn tìm kiếm ai đó ở cùng một địa chỉ bằng cách sử dụng các biến thể nhỏ của thông tin nhận dạng cá nhân của họ để đăng ký nhiều khoản vay.

“Bạn sẽ thấy các yếu tố dữ liệu tương tự nhưng với một số biến, vì vậy bạn không muốn loại bỏ quá nhiều phương sai đó và làm sạch nó quá nhiều”, Buff giải thích.

Mặt khác, cô nói, bộ phận tiếp thị tại tổ chức tài chính đó muốn có phiên bản chính xác của tên, địa chỉ của khách hàng và các thông tin tương tự để nhắm mục tiêu thông tin phù hợp.

3. Chỉ tuyển dụng các nhà khoa học dữ liệu, không phải các kỹ sư dữ liệu

Khi các công ty tìm cách vượt xa BI cơ bản để phân tích dự báo và quy tắc cũng như học máy và trí thông minh nhân tạo, họ cần tăng trình độ chuyên môn về nhóm dữ liệu của mình.

Điều đó đã làm nổi bật tầm quan trọng của nhà khoa học dữ liệu. Kỹ sư dữ liệu cũng rất quan trọng, là người sắp xếp tất cả các bộ dữ liệu cần phải cùng nhau để các nhà khoa học dữ liệu thực hiện công việc của họ. Nhưng lại ít thu hút sự chú ý trong nhiều tổ chức hiện nay.

Điều đó đang thay đổi, theo lời của Lori Sherer, một đối tác trong văn phòng San Francisco của Bain & Co và là trưởng nhóm Phân tích nâng cao và kỹ thuật số của công ty.

“Chúng tôi đã thấy sự tăng trưởng về nhu cầu về kỹ sư dữ liệu gấp khoảng 2 lần sự tăng trưởng nhu cầu về nhà khoa học dữ liệu”, Sherer nói.

Cục Thống kê Lao động liên bang dự đoán nhu cầu về các kỹ sư dữ liệu sẽ tiếp tục tăng trưởng nhanh chóng trong thập kỷ tới, với nền kinh tế Mỹ bổ sung 44.200 vị trí từ năm 2016 đến năm 2026 với mức lương trung bình hàng năm là 135.800 đô la.

Tuy nhiên, giống như nhiều vị trí quan trọng trong CNTT, các chuyên gia nói rằng không có đủ kỹ sư dữ liệu để phù hợp với nhu cầu – làm cho các phòng CNTT hiện đang bắt đầu thuê hoặc đào tạo để bắt kịp.

4. Giữ dữ liệu càng lâu càng tốt, thay vì quản lý vòng đời của nó

Chi phí lưu trữ đã giảm đáng kể trong thập kỷ qua, cho phép CNTT dễ dàng đủ khả năng để lưu trữ dữ liệu lâu hơn bao giờ hết. Điều đó có vẻ giống như tin tốt, xem xét khối lượng và tốc độ dữ liệu hiện được tạo ra cùng với nhu cầu ngày càng tăng để phân tích nó.

Nhưng trong khi nhiều người đã ca ngợi giá trị của việc có nhiều quỹ và dữ liệu, Penny Garbus, đồng sáng lập của Soaring Eagle Consulting tại Apollo Beach, Fla., Và đồng tác giả của Mining New Gold nói. : “nó thường là quá nhiều của một điều tốt”.

Garbus nói quá nhiều doanh nghiệp nắm giữ dữ liệu quá lâu.

“Không chỉ là bạn phải trả tiền cho nó, nhưng nếu nó lớn hơn 10 năm, rất có thể là thông tin là xa hiện tại”, cô nói. “Chúng tôi khuyến khích mọi người đặt một số mốc thời gian trên đó.”

Ngày hết hạn cho dữ liệu thay đổi không chỉ từ tổ chức đến tổ chức, nó thay đổi theo các phòng ban, Garbus nói. Bộ phận inventory trong một công ty bán lẻ có thể chỉ muốn dữ liệu tương đối gần đây, trong khi bộ phận marketing có thể muốn dữ liệu đã cũ để theo dõi xu hướng.

Nếu đúng như vậy, CNTT cần triển khai kiến ​​trúc cung cấp đúng khung thời gian của dữ liệu đến đúng vị trí, để đảm bảo nhu cầu của mọi người được đáp ứng và dữ liệu cũ không làm hỏng các chương trình phân tích kịp thời.

Như Garbus lưu ý: “Chỉ vì bạn phải giữ dữ liệu cũ, không có nghĩa là bạn phải giữ nó trong môi trường cốt lõi của mình. Bạn chỉ cần có nó. ”

5. Tập trung vào khối lượng, thay vì nhắm mục tiêu mức độ liên quan

Steve Escaravage, phó chủ tịch cấp cao của công ty tư vấn IT Booz Allen Hamilton cho biết: “Chúng tôi vẫn đang xây dựng các mô hình và chạy phân tích với dữ liệu có sẵn nhiều nhất chứ không phải với dữ liệu có liên quan nhất”.

Ông cho biết các tổ chức thường xuyên giữ quan điểm sai lầm rằng họ nên nắm bắt và bổ sung thêm nhiều hơn và nhiều tập dữ liệu hơn. Ông nói rằng họ nghĩ rằng “có thể có một cái gì đó trong đó mà chúng tôi đã không tìm thấy hơn là hỏi: Chúng ta có dữ liệu đúng không?”

Xem xét, ông nói, rằng nhiều tổ chức tìm kiếm gian lận bằng cách phân tích một lượng lớn dữ liệu để tìm kiếm những bất thường. Trong khi các tổ chức hàng đầu cũng phân tích một số tập dữ liệu có mục tiêu hơn có thể mang lại kết quả tốt hơn. Trong trường hợp này, họ có thể xem xét các cá nhân hoặc tổ chức đang tạo ra một số loại giao dịch nhất định có thể cho thấy sự cố. Hoặc các tổ chức chăm sóc sức khỏe có thể xem xét, khi phân tích kết quả điều trị của bệnh nhân, dữ liệu liên quan đến thời gian bao lâu bác sĩ đã ở trong ca làm việc của mình, khi họ cung cấp dịch vụ chăm sóc bệnh nhân.

Escaravage cho biết các tổ chức có thể bắt đầu bằng cách tạo danh sách mong muốn dữ liệu. Mặc dù bài tập đó bắt đầu với khía cạnh kinh doanh, “các cơ chế để nắm bắt nó và làm cho nó có sẵn, đó là lĩnh vực của CIO, CTO hoặc giám đốc dữ liệu.”

6. Cung cấp dữ liệu, nhưng bỏ qua nó đến từ đâu

Một trong những chủ đề lớn ngày nay là thiên vị trong phân tích, một kịch bản có thể làm lệch kết quả hoặc thậm chí tạo ra các kết luận bị lỗi dẫn đến các quyết định hoặc kết quả kinh doanh xấu. Các vấn đề tạo ra thiên vị nằm trong nhiều đấu trường khác nhau trong một chương trình phân tích doanh nghiệp – bao gồm cách CNTT xử lý dữ liệu chính nó, Escaravage nói.

Quá thường xuyên, ông nói, CNTT không làm một công việc đủ tốt theo dõi nguồn gốc của dữ liệu mà nó nắm giữ.

“Và nếu bạn không biết điều đó, nó có thể ảnh hưởng đến hiệu suất của các mô hình của bạn”, Escaravage nói, lưu ý sự thiếu khả năng hiển thị về cách thức và nơi dữ liệu bắt nguồn làm cho việc kiểm soát thiên vị còn khó khăn hơn.

“Đó là trách nhiệm của IT để hiểu dữ liệu đến từ đâu và những gì đã xảy ra với nó. Có rất nhiều đầu tư vào quản lý dữ liệu, nhưng cũng cần có một giải pháp quản lý dữ liệu meta”, ông nói.

7. Cung cấp dữ liệu, nhưng không giúp người dùng hiểu ngữ cảnh

CNTT không chỉ có chương trình quản lý siêu dữ liệu mạnh, nơi nó theo dõi nguồn gốc của dữ liệu và cách nó di chuyển qua hệ thống của nó, nó sẽ cung cấp cho người dùng cái nhìn sâu sắc về một số lịch sử đó và cung cấp ngữ cảnh cho một số kết quả được tạo ra thông qua phân tích, Escaravage nói.

“Chúng tôi rất vui mừng về những gì chúng tôi có thể tạo ra. Chúng tôi nghĩ rằng chúng tôi có dữ liệu khá tốt, đặc biệt là dữ liệu chưa được phân tích và chúng tôi có thể xây dựng mô hình về cách dữ liệu này hữu ích”, ông nói. “Nhưng trong khi các phương pháp phân tích trong nửa thập kỷ qua thật tuyệt vời, kết quả của những kỹ thuật này ít diễn giải hơn trong quá khứ khi bạn áp dụng quy tắc kinh doanh sau khi khai thác dữ liệu và dễ dàng diễn giải dữ liệu.”

Các mô hình học tập sâu hơn, mới hơn cung cấp thông tin chi tiết và gợi ý có thể hành động, Escaravage giải thích. Nhưng các hệ thống này thường không cung cấp ngữ cảnh có thể hữu ích hoặc thậm chí quan trọng đối với việc ra quyết định tốt nhất. Nó không cung cấp, ví dụ, thông tin về xác suất so với sự chắc chắn rằng một cái gì đó sẽ xảy ra dựa trên dữ liệu.

Giao diện người dùng tốt hơn là cần thiết để giúp cung cấp bối cảnh đó, Escaravage nói.

“Vấn đề kỹ thuật là cách mọi người sẽ giao tiếp với các mô hình này. Đây là nơi tập trung vào UI / UX từ quan điểm minh bạch sẽ rất quan trọng. Vì vậy, nếu ai đó nhìn thấy đề xuất từ ​​nền tảng AI, họ có thể đi sâu đến mức nào để xem nguồn dữ liệu cơ bản, v.v.? ”, Anh nói. “CIO sẽ phải hỏi làm thế nào để xây dựng vào hệ thống của họ mức độ minh bạch.”

Nguồn: theo cio.com