Khai Thác Dữ Liệu (Data Mining)

31/03/2014

ĐỀ CƯƠNG CHI TIẾT

1. Tên môn học: Khai Thác Dữ Liệu (Data Mining)
2. Giảng viên: Hoàng Trọng, email: htrong@ueh.edu.vn
3. Bậc đào tạo: Đại học Hệ đào tạo : Chính quy Khóa : K35
4. Thời lượng: 2 tín chỉ
5. Điều kiện tiên quyết (các môn học phải học trước):
- Phân tích dữ liệu thị trường II (học phần học trước)

6. Mô tả môn học:
Môn học Khai thác dữ liệu cung cấp một cách có hệ thống các phương pháp khai thác dữ liệu cơ bản được sử dụng phổ biến trong kinh doanh. Môn học này trang bị cho sinh viên những khái niệm căn bản, quy trình thực hiện, các kỹ thuật, giải thuật và mô hình khai thác dữ liệu ở giác độ ứng dụng đối với các cơ sở dữ liệu lớn của các doanh nghiệp.

7. Mục tiêu:
Học xong môn học Khai thác dữ liệu, với các ví dụ cụ thể tại các tổ chức kinh doanh thực tế, người học sẽ hiểu được ý nghĩa của khai thác dữ liệu trong việc giúp nâng cao hiệu quả và hiệu năng của các tổ chức kinh doanh. Bên cạnh việc hiểu được các khái niệm, các quy trình, phương pháp và mô hình khai thác dữ liệu; sinh viên có khả năng hiểu được các yêu cầu phân tích dữ liệu trong kinh doanh, biết chuyển các yêu cầu đó thành những bài toán khai thác dữ liệu cụ thể, chuẩn bị hay thiết kế các cơ sở dữ liệu đáp ứng được các yêu cầu khai thác dữ liệu đặt ra, lựa chọn mô hình hay phương pháp khai thác dữ liệu phù hợp để đáp ứng tốt nhu cầu khai thác dữ liệu. Song song đó, người học còn có khả năng biết diễn dịch ý nghĩa của kết quả khai thác dữ liệu cho các bộ phận có liên quan trong doanh nghiệp và hỗ trợ các bộ phận này trong việc vận dụng các kết quả phân tích cho các hành động cụ thể nhằm nâng cao hiệu quả kinh doanh của doanh nghiệp.

Sinh viên biết sử dụng các phần mềm hỗ trợ khai thác dữ liệu đơn giản và phổ biến, và chuẩn bị nền tảng khái niệm, quy trình, phương pháp, giải thuật tốt cho việc sẵn sàng làm quen và sử dụng được các chương trình máy tính khai thác dữ liệu chuyên biệt hay quy mô lớn do các doanh nghiệp lớn mua và huấn luyện sử dụng. Ngoài ra người học còn có khả năng đánh giá điểm mạnh, điểm yếu của các chương trình phần mềm khai thác dữ liệu để chọn phần mềm khai thác dữ liệu phù hợp với điều kiện của doanh nghiệp và đặc thù của cơ sở dữ liệu đang có hay sẽ có.

8. Phương pháp giảng dạy :
Diễn giảng với máy chiếu đa phương tiện.

9. Phương pháp đánh giá:

  • Phương pháp đánh giá quá trình (chuyên cần, bài tập, làm việc nhóm, thảo luận, kiểm tra giữa kỳ…): 40%
    • Kiểm tra: 20%
    • Bài Tập: 20%
  • Thi hết môn 60%

Tổng cộng : 100%
Hình thức thi kết thúc môn học: thi viết, được sử dụng tài liệu.

10. Tài liệu đọc bắt buộc (giáo trình, tài liệu tham khảo chính, tài liệu dịch, phương tiện học tập khác,…):
- Tài liệu tham khảo chính:
[1] Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Lê Thùy Nguyên (2009), Giới thiệu Khai thác dữ liệu Kinh Doanh, Tài liệu biên soạn từ sách tiếng Anh “Introduction to Business Data Mining” của David Olson và YongShi (2007), NXB McGraw-Hill
- Tài liệu tham khảo:
[2] Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008), Phân tích dữ liệu nghiên cứu với SPSS (Tập 2), TPHCM, NXB Hồng Đức

11. Nội dung môn học (lịch giảng dạy; các chương, phần; thời lượng cho mỗi chương, phần):

Ngày
(số tiết)

Nội dung giảng dạy
(tên chương, phần, phương pháp giảng dạy)

Tài liệu đọc (chương)

Chuẩn bị của sinh viên 
(bài tập, thuyết trình, giải quyết tình huống…)

Ngày 
(2 tiết)

Chương 1: Giới thiệu khai thác dữ liệu trong kinh doanh
1. Giới Thiệu khai thác dữ liệu
2. Khai thác dữ liệu kinh doanh

  • Bán lẻ
  • Ngân hàng
  • Quản lý thẻ tín dụng
  • Bảo hiểm
  • Viễn thông
  • Tiếp thị từ xa
  • Quản lý nhân sự

3. Các công cụ khai thác dữ liệu

 

[1]
chương 1

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 2: Quy trình khai thác dữ liệu và khám phá tri thức
1. Quy trình chuẩn CRISP-DM

  • Hiểu yêu cầu
  • Hiểu dữ liệu
  • Chuẩn bị dữ liệu
  • Xây dựng mô hình
  • Đánh giá

2. Quy trình khám phá tri thức

 

[1]
chương 2

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 3: Cơ sở dữ liệu hỗ trợ cho khai thác dữ liệu
1. Kho dữ liệu
2. Cơ sở dữ liệu chuyên biệt
3. Xử lý phân tích dữ liệu trực tuyến - OLAP
4. Triển khai kho dữ liệu
5. Mô tả dữ liệu
6. Minh họa hệ thống
7. Chất lượng dữ liệu
8. Phần mềm máy tính
9. Ví dụ thực tế

 

[1]
chương 3

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chöông 4: Tổng quan về các kỹ thuật khai thác dữ liệu
1. Các mô hình khai thác dữ liệu
2. Bối cảnh khai thác dữ liệu
3. Các chức năng khai thác dữ liệu
4. Các bộ dữ liệu minh họa

 

[1]
chương 4

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(2 tiết)

Chương 5: Phân tích lập nhóm
1. Giới thiệu phân tích lập nhóm
2. Mô tả phân tích lập nhóm
3. Thay đổi số nhóm
4. Ứng dụng phân tích lập nhóm
5. Sử dụng phân tích lập nhóm trong phần mềm máy tính
6. Ứng dụng phương pháp vào bộ dữ liệu lớn

 

[1]
chương 5

[2]
chương 14

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 6: Các giải thuật trong khai thác dữ liệu
1. Giới thiệu phân tích lập nhóm
2. Mô tả phân tích lập nhóm
3. Thay đổi số nhóm
4. Ứng dụng phân tích lập nhóm
5. Sử dụng phân tích lập nhóm trong phần mềm máy tính
6. Ứng dụng phương pháp vào bộ dữ liệu lớn

 

[1]
chương 6

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 7: Mạng thần kinh (Neural network) trong khai thác dữ liệu
1. Mạng thần kinh
2. Mạng thần kinh trong khai thác dữ liệu
3. Các ứng dụng của mạng thần kinh trong kinh doanh
4. Ứng dụng mạng thần kinh vào bộ dữ liệu lớn
5. Các phần mềm mạng thần kinh

 

[1]
chương 7

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 8: Giải thuật cây quyết định
1. Hoạt động cây quyết định
2. Học máy
3. Các ứng dụng của cây quyết định
4. Ứng dụng cây quyết định vào bộ dữ liệu lớn
5. Các phần mềm cây quyết định

 

[1]
chương 8

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 9: Phương pháp quy hoạch tuyến tính
1. Phân tích biệt số tuyến tính
2. Phân loại dùng quy hoạch tuyến tính đa tiêu chuẩn
3. Phân loại dùng quy hoạch tuyến tính mờ
4. Quản lý danh mục thẻ tín dụng
5. Phần mềm hỗ trợ quy hoạch tuyến tính

 

[1]
chương 9

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(3 tiết)

Chương 10: Các ứng dụng của khai thác dữ liệu trong kinh doanh
1. Các ứng dụng

  • Tối ưu hóa dòng thư
  • Quản lý quan hệ khách hàng CRM
  • Chấm điểm tín dụng
  • Phân tích rủi ro đầu tư
  • ứng dụng khai thác dữ liệu trong bảo hiểm

2. So sánh các phương pháp khai thác dữ liệu

 

[1]
chương 10

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Ngày 
(2 tiết)

Chương 11: Phân tích rổ hàng mua
1. Định nghĩa
2. Ví dụ minh họa
3. Giới hạn của phân tích rổ hàng
4. Phần mềm máy tính phân tích rổ hàng mua

 

[1]
chương 11

Đọc tài liệu trước
Nghe giải thích các khái niệm
Làm các bài tập
Kiểm tra nhanh 10 phút
Thảo luận các câu hỏi kiểm tra

Tổng cộng :
30 tiết

     

 Giáo viên xây dựng đề cương

Hoàng Trọng