Trong chương này, ch ng ta đ tìm hi u c c bước cần thi t đ
x y d ng một ng dụng mạng Nơ-ron. Theo đ , ta phải chọn ki n
tr c mạng, thuật to n học phù hợp với yêu cầu c a bài to n. Ti p
theo là chọn số lớp ẩn c a mạng (đi u này phụ thuộc vào việc ta
chọn thuật to n học nào). Bên cạnh đ , ta cũng sẽ x c định hàm
truy n cho mạng cũng như c c tham số cần thi t kh c.
Chương 3 cũng trình bày u trình x y d ng một ng dụng.
ng dụng này được x y d ng trên cơ s cải ti n thuật to n lan truy n
ngược nhằm r t ng n thời gian học c a mạng, tăng tốc độ hội tụ c a
mạng cũng như m rộng phạm vi p dụng cho c c hàm phi tuy n.
Bằng kỹ thuật lập trình Dot.net trên n n tảng indo s, chạy
m y đơn, khai th c cơ s d liệu uan hệ m c độ v a phải trên hệ
uản trị ( l erver, Fpxpro). Mục tiêu c a ng dụng là nhằm th
nghiệm c c ki n th c đ tìm hi u trong phần lý thuy t. Qua đ xem
xét khả năng m rộng c a ng dụng sau này.
26 trang |
Chia sẻ: tienthan23 | Lượt xem: 1950 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận văn Ứng dụng khai phá tri thức xây dựng hệ thống trợ giúp thẩm định vay vốn tại ngân hàng VietComBank Quảng Bình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN TRẦN SỸ
ỨNG DỤNG KHAI PHÁ TRI THỨC
XÂY DỰNG HỆ THỐNG TRỢ GIÚP THẨM
ĐỊNH VAY VỐN TẠI NGÂN HÀNG
VIETCOMBANK QUẢNG BÌNH
Chuyên ngành : Khoa học máy tính
Mã số: 60.48.01
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2013
Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: PGS.TS. PHAN HUY KHÁNH
Phản biện 1: GS.TSKH. TRẦN QUỐC CHIẾN
Phản biện 2: GS.TS. NGUYỄN THANH THỦY
Luận văn được bảo vệ tại Hội đồng chấm luận văn tốt
nghiệp Thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 28
tháng 12 năm 2013.
* Có thể tìm hiểu luận văn tại:
Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng
1
MỞ ĐẦU
1. Giới thiệu và lý do chọn đề tài
ph t tri n c a công nghệ thông tin đ mang lại cho nh n
loại nhi u tiện lợi và gi p giải uy t nh ng công việc tư ng ch ng
như con người không th giải uy t được. Trong đ , khai ph tri th c
trong cơ s d liệu đang là một xu hướng uan trọng c a n n Công
nghệ thông tin th giới. N c khả năng ng dụng vào rất nhi u lớp
bài to n th c t kh c nhau. Bước uan trong nhất c a u trình này
là khai ph tri th c t d liệu, gi p con người thu được nh ng tri
th c h u ích t nh ng cơ s d liệu hoặc c c nguồn d liệu khổng lồ
khác. Một số ít ng n hàng thương mại, doanh nghiệp và tổ ch c trên
th giới đ ng dụng kỹ thuật khai ph tri th c t d liệu vào các
hoạt động tín dụng đ ph t tri n sản xuất và kinh doanh, đ và đang
thu được nh ng lợi ích to lớn.
Hiện nay, việc ng dụng công nghệ thông tin trong nhi u lĩnh
v c c a đời sống, kinh t x hội trong nhi u năm ua cũng đồng
nghĩa với lượng d liệu đ được c c cơ uan, các tổ ch c tín dụng
thu thập và lưu tr ngày một tích luỹ nhi u lên. Người ta lưu tr c c
d liệu này vì cho rằng trong n ẩn ch a nh ng gi trị nhất định nào
đ . Tuy nhiên, theo thống kê thì chỉ c một lượng nhỏ c a nh ng d
liệu này (khoảng t 20% đ n 25%) là luôn được ph n tích, số còn lại
người ta không bi t sẽ phải làm gì hoặc c th làm gì với ch ng
nhưng vẫn phải ti p tục thu thập rất tốn kém với ý nghĩ lo sợ rằng sẽ
c c i gì đ uan trọng đ bị bỏ ua sau này c l c cần đ n n . Mặt
kh c, trong môi trường cạnh tranh khốc liệt như hiện nay và s xuất
hiện nhi u nhi u ng n hàng thương mại và n n kinh t đang c
chuy n bi n xấu và đầy ph c tạp, nhân viên ngân hàng ngày càng
cần c nhi u thông tin với tốc độ nhanh đ trợ gi p việc ra uy t
định và ngày càng c nhi u c u hỏi mang tính chất định tính cần phải
2
trả lời d a trên một khối lượng d liệu khổng lồ đ c . Việc ng
dụng công nghệ thông tin trong ng n hàng đang rất cần thi t, đặc biệt
là ng dụng khai ph tri th c t d liệu.
uất ph t t th c t và nhu cầu n m b t, trang bị hạ tầng v
công nghệ thông tin c a cơ uan, tổ ch c đ hiện đại ho công việc,
gi p giải uy t nhanh ch ng, n ng cao hiệu uả và d b o chính x c
trong công việc nhất là trong lĩnh v c kinh doanh, thương mại điện
t trong vấn đ trợ gi p thẩm định vay vốn tại ng n hàng. T lý do
đ , tôi chọn đ tài: Ứng dụng khai phá tri thức xây dựng hệ thống
thẩm định vay vốn tại Ngân hàng Vietcombank Quảng Bình.
Đ nghiên c u làm luận văn tốt nghiệp cao học ngành hoa
học m y tính. Trong đ , tập trung vào nghiên c u kỹ thuật mạng Nơ-
ron, p dụng trong việc khai ph tri th c t d liệu đ giải uy t bài
toán.
2. Mục tiêu và nhiệm vụ
Mục tiêu c a đ tài tìm hi u c c khai ph tri th c trong lĩnh
v c hoạt động thẩm định vay vốn tại ng n hàng, đặc biệt là vấn đ ra
uy t định trong hoạt động thẩm định tín dụng đạt k t uả ra sao.
Nhiệm vụ cơ bản c a nghiên c u: (1) Thu thập và ph n tích d
liệu tri tr c v tình hình kh ch hàng được thẩm định; (2) Tìm hi u
bài to n th c t : Thẩm định hoạt động vay vốn ng n hàng; (3) Tìm
hi u tổng tổng uan v c c kỷ thuật khai ph tri th c; (4) Tìm hi u
cơ s lý thuy t khai ph luật k t hợp, kỷ thuật mạng Nơ-ron; (5) Xây
d ng mô hình và ph n tích thi t k hệ thống trợ giúp d b o thẩm
định vay vốn trong ng n hàng.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng ch y u đ nghiên c u luật k t hợp và kỹ thuật
mạng Nơ-ron, c c thuật to n học c a mạng Nơ-ron, đặc biệt là thuật
3
to n lan truy n ngược (Back propagation algorithm). Ngoài ra, cũng
cần phải n m được c c kỹ thuật lập trình cơ bản trên n n indo .
4. Phương pháp nghiên cứu
Thu thập, ph n tích c c tài liệu và thông tin liên uan đ n đ
tài; em xét, l a chọn phương hướng giải uy t vấn đ ; y d ng
mô hình theo lý thuy t; Tri n khai x y d ng chương trình ng dụng
trên m y tính; i m tra, th nghiệm và đ nh gi k t uả.
5. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học c a đ tài là nghiên c u và ph t tri n một
mô hình khai ph d liệu nhằm d b o độ r i ro trong việc phê duyệt
đơn vay tín dụng c a ng n hàng, d a trên kỹ thuật mạng Nơ-ron.
Việc d b o c c k t uả sẽ h trợ, trợ gi p cho nhà uản lý trong
việc ra c c uy t định tối ưu.
. Bố cục của lu n văn
Luận văn bao gồm c c phần như sau:
M đ u
Chương 1:
Nêu tổng uan v khai ph tri th c t d liệu. Các kỹ thuật
mạng Nơ-ron trong khai ph d liệu, c c thuật to n trong mạng Nơ-
ron, cũng như c c lĩnh v c ng dụng.
Chương 2:
Ph n tích bài to n. iới thiệu bài to n, nêu lên bài to n cụ th
và x y d ng mô hình tổng u t cho bài to n, giải ph p giải uy t bài
toán.
Chương 3:
y d ng hệ thống trợ gi p thẩm định vay vốn ng n hàng. Tạo
bộ d liệu mẫu v d liệu đầu vào, d liệu c a tập huấn luyện, tập
ki m th , vận hành mạng và cho ra k t uả th nghiệm. Trên cơ s
đ đưa ra c c đ nh gi v giải ph p c a đ tài trong việc ng dụng
4
th c ti n c a vấn đ cũng như c nh ng so s nh với c c giải ph p
kh c. t luận c a đ tài v c c mặt làm được, khả năng ng dụng,
nh ng ưu và nhược đi m và hướng ph t tri n trong tương lai.
CHƯƠNG 1
CƠ SỞ LÝ THUYẾT
1.1. GIỚI THIỆU VỀ KHAI PHÁ TRI THỨC
Ph t hiện tri th c là kh i niệm ra đời vào nh ng năm cuối c a
thập kỷ 80 và đ tr thành một lĩnh v c được nguyên c u rộng r i
trên toàn cầu. ra đời c a ph t hiện tri th c là s k t hợp k t uả
nguyên c u c a nhi u ngành khoa học kh c lại với nhau như: Quản
trị cơ s d liệu, học m y, thống kê
1.2. ĐỊNH NGHĨA KHAI PHÁ TRI THỨC
Th c chất đ là u trình tìm ki m nh ng thông tin c trong
cơ s d liệu nhưng bị che giấu trong c c khối d liệu.
Tri th c đ y c th được hi u là một bi u th c trong một
ngôn ng . C c ngôn ng thường dùng đ di n tả tri th c trong việc
bi u di n tri th c trong u trình ph t hiện tri th c t cơ s dư liệu là
c c khung (frames), c c c y và đồ thị, c c luật, c c công th c trong
logic mệnh đ hoặc logic t n t cấp một...
Việc khai ph tri th c thường được p dụng đ giải uy t một
loạt nh ng y u cầu phục vụ nh ng mục đích nhất định. Vì vậy, u
trình ph t hiện tri th c là một hoạt động tương t c gi a một người s
dụng hoặc một chuyên gia ph n tích với c c công cụ tin học.
1.3. CÁC GIAI ĐOẠN QUÁ TRÌNH KHAI PHÁ TRI THỨC
Qu trình khai ph tri th c, t nh ng cơ s d liệu th c t sau
một hoặc một số bước c a u trình sẽ r t ra được nh ng tri th c
mới. C c bước trong u trình này c th lặp đi lặp lại nhi u lần và
được mô tả theo hình sau:
5
Hình 1.1 ơ đồ mô tả u trình khai ph tri th c
1.4. MÔ HÌNH KHAI PHÁ TRI THỨC
Hình 1.2 Mô hình khai ph tri th c
Hình thành và
xác định vấn đề
Khai phá dữ liệu,
rút ra các tri thức
Thu thập và tiền
xử lý dữ liệu
Giải thích kết quả
và đánh giá
Sử dụng các tri thức
phát hiện được
1
2
3
4
5
6
1.5. KHO DỮ LIỆU (DATA WAREHOUSE)
Là c c cơ s d liệu tích hợp, hướng theo c c ch đ nhất
định, được thi t k đ h trợ cho ch c năng trợ gi p uy t định, mà
m i đơn vị d liệu liên uan đ n một khoảng thời gian cụ th .
ho d liệu thường c dung lượng rất lớn, thường là hàng
igabytes hay c khi tới hàng Terabytes. ho d liệu được x y d ng
đ tiện lợi cho việc truy cập t nhi u nguồn, nhi u ki u d liệu kh c
nhau sao cho c th k t hợp được cả nh ng ng dụng c a c c công
nghệ hiện đại và v a c th k th a được t c c hệ thống đ c t
trước. D liệu được ph t sinh t c c hoạt động hàng ngày và được
thu thập x lý đ phục vụ công việc nghiệp vụ cụ th c a một tổ
ch c, vì vậy thường được gọi là d liệu t c nghiệp và hoạt động x
lý d liệu này gọi là xử lý giao dịch trực tuyến (OLPT - On Line
Transaction Processing).
1.6. LUẬT KẾT HỢP
Nhằm ph t hiện ra c c Luật k t hợp gi a c c thành phần d
liệu trong cơ s d liệu. C c luật k t hợp c th là một c ch hình
th c h a đơn giản. Ch ng rất thích hợp cho việc tạo ra c c k t uả c
d liệu dạng nhị ph n. iới hạn cơ bản c a phương ph p này là
ch c c uan hệ cần phải thưa theo nghĩa không c tập thường xuyên
nào ch a nhi u hơn 15 thuộc tính. iải thuật tìm ki m c c luật k t
hợp tạo ra số luật ít nhất phải bằng với số c c tập phổ bi n và n u
như một tập phổ bi n c kích thước thì phải c ít nhất là 2 tập
phổ bi n. Thông tin v c c tập phổ bi n được s dụng đ ước lượng
độ tin cậy c a c c tập luật k t hợp.
1.6.1. Lý thuyết về lu t kết hợp
1.6.2. Định nghĩa lu t kết hợp
Mà c c luật đ u phải thoả m n một ngưỡng h trợ và tin cậy
cụ th . Th c vậy, cho một tập c c giao dịch D, bài to n ph t hiện luật
7
k t hợp là sinh ra tất cả c c luật k t hợp mà c độ tin cậy conf lớn
hơn độ tin cậy tối thi u mincon và độ h trợ sup lớn hơn độ h trợ tối
thi u minsup tương ng do người dùng x c định. hai ph luật k t
hợp được ph n thành hai bài to n.
1.6.3. Một số tính chất liên quan đến các hạng mục phổ
biến (frequent itemset)
Tính chất 1: Độ h trợ (support) cho tất cả c c tập con
(subset).
Tính chất 2: N u một mục trong A không c độ h trợ tối
thi u trên D nghĩa là support(A)< minsup thì một tập con B c a A sẽ
không phải là một tập phổ bi n vì support(B) ≤ support(A) <
minsup.
Tính chất 3: N u mục B là mục phổ bi n trên D, nghĩa là
support(B) ≥ minsup thì mọi tập con A c a B là tập phổ bi n trên D
vì support(A) ≥ support(B) > minsup.
1.6.4. Một số hướng tiếp c n trong khai phá lu t kết hợp
Luật k t hợp nhị ph n (binary association rule hoặc boolean
association rule); Luật k t hợp c thuộc tính số và thuộc tính hạng
mục ( uantitative and categorial association rule); Luật k t hợp ti p
cận theo hướng tập thô (mining association rules base on rough set):
Tìm ki m luật k t hợp d a trên lý thuy t tập thô...
1.6.5. Phát biểu bài toán phát hiện lu t kết hợp
ét ví dụ đối tượng trong giao dịch cho vay khách hàng
tại đơn vị . Tập c c giao dịch ( đ y coi là tập c c mục) I =
{khá, tốt, trung bình, xấu} và số c c đối tượng cho vay là 4
giao dịch (|T| = 4), trong đ T = {1, 2, 3, 4} – ký hiệu c c giao
dịch TID.
1.6.6. Phát hiện lu t kết hợp dựa trên hệ thông tin nhị
phân
8
Hệ thông tin nhị ph n; Tập chỉ b o phổ bi n nhị ph n; C c luật
k t hợp phổ bi n nhị ph n và hệ số tin cậy; C c vectơ chỉ b o nhị;
phân và các phép toán; Tích vectơ chỉ b o nhị ph n; Độ h trợ c c
vectơ chỉ b o nhị ph n
1.6.7. Thu t toán phát hiện t p chỉ báo và lu t kết hợp nhị
phân
Thuật to n Apriori-Tid có hai pha
1.6.8. Khai phá lu t kết hợp trên hệ thông tin mờ
1.7. MẠNG NEURON
ỹ thuật mạng Nơ-ron là kỹ thuật mới liên uan đ n việc ph t
tri n c c cấu tr c to n học với khả năng học. Mạng Nơ-ron c th
đưa ra ý nghĩa t d liệu ph c tạp nhi u chi u và ph t hiện xu hướng
c a d liệu mà c c kỹ thuật kh c không th th c hiện được. Mạng
Nơ-ron c khả năng mô hình ho nh ng d liệu ph c tạp và nhi u
chi u. hi d liệu tăng lên, c c kỹ thuật truy n thống kh c c th
không giải uy t được, nhưng mạng Nơ-ron c khả năng giải uy t
tốt.
1.7.1. Khái niệm mạng Nơ-ron
1.7.2. Mạng Nơ-ron truyền thẳng
Cấu tr c c a mạng Nơ-ron gồm c c n t, m i n t đ u c các
trọng số và được bố trí trên c c tầng như: Tầng vào; Tầng ẩn;Tầng
ra.
Hình 1.3: Cầu tr c mạng Nơ-ron truy n thẳng.
... ..
..
..
..
Tầng vào C c tầng
ẩn
Tầng ra
... ..
t uả D liệu
vào
9
1.7.3. Mạng Nơ-ron phản hồi
Tùy sơ đồ k t nối mà mạng c th là mạng truy n thẳng (feed
for ard) hoặc phản hồi (recurrent) c c đường k t nối là đối x ng
hoặc không đối x ng. Mạng phản hồi c đường nối phản hồi hoặc c
chu trình gi a c c n t. au đ y là cấu tr c c a một mạng phản hồi:
Hình 1.4 Cấu tr c mạng Nơ-ron phản hồi
1.7.4. Giải pháp k thu t của mạng Nơ-ron
Mạng Nơ-ron được hi u theo c hai khía cạnh: tính to n và
học. Phần tính to n được th c hiện theo th t . Phần học thì được
th c hiện ngược lại: với số liệu tính to n đầu ra không khớp với mục
tiêu, sai số này sẽ làm cơ s đ thay đổi c c trọng số n t xuất, sau đ
được lan truy n đ thay đổi trọng số c c n t ẩn. Qu trình này được
th c hiện nhi u lần cho đ n khi k t xuất c a mạng ti n gần đ n mục
tiêu đ ra.
1.8. QUÁ TRÌNH TÍNH TOÁN CỦA MẠNG NƠ-RON
1.8.1. Hàm truyền
V mặt hình học, hàm truy n c dạng ch nên n được gọi
là hàm dạng .
1.8.2. Tính toán của mạng
Mạng Nơ-ron là một công cụ tính to n, theo nghĩa nào đ thì
mạng Nơ-ron làm việc với tư c ch là một bảng tra mà không bi t phụ
thuộc hàm tường minh gi a x và y. Việc tính to n c a mạng Nơ-ron
số n t c trong mạng.
Tầng vào
Tầng ẩn
Tầng ra
10
Mạng một nút nhập, một nút xuất
Mạng hai nút nhập
Mạng nhiều nút nhập
Lan truyền tiến
hi luyện mạng, lan truy n ti n được s dụng lặp đi lặp lại t
mẫu này đ n mẫu kh c cho đ n khi c c trọng số đạt được gi trị thích
hợp. hi s dụng, lan truy n ti n được s dụng một lần cho t ng
trường hợp nhập vào.
1.8.3. Sự chuẩn bị và học dữ liệu
Học là một trong nh ng đặc tính uan trọng nhất c a mạng.
N chỉ ra c ch đi u chỉnh trọng số trong u trình học. Trong u
trình học, ta cần bi t m c tích c c th c t so s nh với m c tích c c
mong muốn đ tính sai số. ai số này s dụng đ đi u chỉnh trọng số
c a mạng.
Trong mô hình mạng Nơ-ron thì việc x c định sai số ít nhất là
rất kh . Phương ph p giảm gradient thường được s dụng trong c c
trường hợp này. Phương ph p xem E là một mặt l i và x c định c c
trọng số ua c c bước chính như sau: (1) Chọn một đi m ngẫu nhiên
x0 trong không gian trọng số; (2) Tính độ dốc c a mặt l i tại x0; (3)
Cập nhật c c trọng số theo hướng dốc nhất c a mặt l i; (4) Xem
đi m này như đi m x0 mới; (5) Lặp đi lặp lại u trình t (2) đ n (4)
thì đ n một l c nào đ c c gi trị c a bộ trọng số sẽ ti p cận đ n
đi m thấp nhất trong mặt l i.
Trọng số nút xuất
Trọng số nút ẩn
1.9. MỘT SỐ THUẬT TOÁN ÁP DỤNG TRONG VIỆC HỌC
CỦA MẠNG NƠ-RON
1.9.1. Lý thuyết thống kê học
1.9.2. Cực tiểu rủi ro kinh nghiệm
11
1.9.3. Generalization
Theo c ch nhìn c a việc ọc mạng -ron, được gọi là l i
t ng u t.
1.9.5 Mạng Nơ-ron truyền thẳng (Feed-Foward Neural
Networks)
a. rc ptr n và luật lta
b Tri thức a l p và Lan truyền ngư c
c. Radial Basic Fuction Networks
Một ki n tr c mạng Nơ-ron phổ bi n kh c đang được s dụng
i u mạng này được gọi là mạng radial basic function (RBF).
d Mạng v c tơ h tr ch ph n l p
Trường hợp phân tuyến dữ liệu
Trường hợp không phân tuyến dữ liệu
Ph n thủ thu t (kernel trick
Chọn lựa của các tham số kernel
Mạng v c tơ h trợ cho việc học c ưu tiên
Vấn đề học c ưu tiên
Công thức của vấn đề
Mô hình tiện ích ẩn
Mô hình tuyến tính của tiện ích ẩn
Mô hình phi tuyến tính của tiện ích ẩn
Ứng dụng kinh tế
1.1 . SỰ KẾT HỢP CỦA CÁC KỸ THUẬT
C c kỹ thuật khai ph d liệu đ u c nh ng ưu và nhược đi m
c a riêng n , chẳng hạn mạng Nơ-ron rất hiệu uả trong việc p
dụng khai ph d liệu d đo n cho k t uả tốt mà c c kỹ thuật kh c
không th làm được. Tuy nhiên, việc học c a mạng d liệu này là rất
tốn thời gian, do đ , cần c s k t hợp gi a c c kỹ thuật này với
nhau. k t hợp này được th hiện như hình dưới đ y:
12
Hình 1.6: t hợp c c kỹ thuật đ đưa ra giải ph p mới.
Kết lu n chương 1
Như vậy, nhìn vào c c phương ph p giới thiệu trên, ch ng ta
thấy c rất nhi u c c phương ph p khai ph d liệu. M i phương
ph p c nh ng đặc đi m riêng phù hợp với một lớp c c bài to n với
c c dạng d liệu và mi n d liệu nhất định.
Tổng k t sơ bộ v khai ph d liệu, nguồn gốc và ng dụng
c a khai ph d liệu. Đ tìm hi u r hơn v kỹ thuật khai ph d liệu,
Sau khi giới thiệu c c nét cơ bản c a lý thuy t thống kê học, ch ng ta
đ tìm hi u v định nghĩa mạng Nơ-ron, c c ki u mạng Nơ-ron. Đ
tìm hi u c c nguyên lý cơ bản c a việc học trong mạng Nơ-ron.
Chương này cũng đ đ cập đ n c c thuật to n học thường
dùng. Đ là: học c tri th c (Perceptron Learning), học lan truy n
ngược (Backpropagation Lear) và học với hàm b n kính cơ bản
(Radial Basis Function Learning). Qua đ ta thấy mạng nơ-ron có
tính chất sau: Là hệ phi tuy n; Là hệ x lý song song; Là hệ nhi u
bi n, c nhi u đầu vào/ra rất tiện dùng khi đi u khi n đối tượng c
nhi u bi n số c khả năng học và làm xấp xỉ c c hàm to n học bất kỳ
với độ chính x c tuỳ ý
Tập mẫu
Trường hợp mới
ỹ thuật 1
ỹ thuật 2
Đ p ng yêu cầu
iải ph p
13
CHƯƠNG 2
PHÂN TÍCH BÀI TOÁN
2.1 GIỚI THIỆU
Ngân hàng Ngân hàng Ngoại thương Quảng Bình và chính
th c đi vào hoạt động t 20/11/2006.
V phát tri n tín dụng Vietcombank Quảng Bình áp dụng nhi u
biện ph p đ v a tăng trư ng tín dụng, xong còn nhi u r i ro và
ph c tạp trong thẩm định khách hàng và doanh nghiệp, đ đ p ng
được nhu cầu tín dụng c a khách hàng, góp phần đẩy mạnh phát
tri n kinh t - xã hội trên địa bàn v a đảm bảo nâng cao chất lượng
tín dụng và hiệu quả. Vietcombank Quảng Bình cần có công cụ h
trợ bên cạnh nghiệp vụ như s dụng kinh nghiệm thì cần phải có s
trợ giúp c a máy tính. T đ kh u cho vay và kh u trả nợ vay cho
ngân hàng đầy đ và đ ng thời hạn (D a trên số liệu hiện có).
Bên cạnh đ chất lượng c n bộ tín dụng đang giảm s t do
thi u thông tin, thi u tri th c, đ là nhận định c a nhi u người kinh
doanh hoạt động trong c c tổ ch c tín dụng (Nợ xấu, mất khả năng
thanh to n, đối tượng cho vay không đ ng...). Bên cạnh thời đại
bùng nổ thông tin hiện nay. Hàng ngày, c n bộ tín dụng ti p nhận
nhi u thông tin t nhi u nguồn kh c nhau (T giao ti p, văn bản,
thông tin truy n thông, và kho d liệu đơn vị). ho d liệu ch a c c
thông tin c a c c doanh nghiệp ngày càng lớn dần. Trong khi đ ,
việc khai th c tri th c t nh ng kho d liệu đ chưa được uan t m
đ ng m c.
Chính vì vậy kho d liệu phần lớn chỉ được s dụng đ x y
d ng c c b o c o mang tính thống kê. Được xem như một c ch ti p
cận mới trong việc tìm ki m tri th c t d liệu. T nh ng tập d liệu
khổng lồ và h n tạp, c th tìm ra nh ng uy luật chưa được bi t đ n
14
đ giải thích h trợ cho nh ng hiện tượng th c t trong việc thẩm
định vay vốn.
dụng phương ph p khai ph tri th c t d liệu đ d đo n
trong hoạt động thẩm định vay vốn là một phương ph p mới nhằm
n ng cao chất lượng thẩm định tín dụng c a ng n hàng.
2.2. THỐNG KÊ TÌNH HÌNH VAY VỐN THEO NGHÀNH
KINH TẾ TRONG 3 NĂM QUA TẠI NGÂN HÀNG THƯƠNG
MẠI CỔ PHẦN NGOẠI THƯƠNG QUẢNG BÌNH.
D a trên số liệu tình hình vay vốn c a ng n hàng thương mại
cổ phần ngoại thương Việt Nam – chi nh nh Quảng Bình, trong ba
năm ua ta thấy s bi n đổi ph c tạp cho vay c a c c thành phần
kinh t c s thay đổi rỏ rệt. Đ là s gia tăng hoặc giảm xuống c a
c c thành phần kinh t trong hoạt động tín dụng c chi u hướng tăng
mạnh, hoặc tăng trư ng tín dụng rất thấp hay không tăng.
2.3. BÀI TOÁN
Ng n hàng TMCP là một tổ ch c tín dụng, th c hiên c c hoạt
động kinh doanh hằng ngày. Trong đ c hoạt động cho vay, th c
hiện xem xét, ki m tra xem xét c c hồ sơ kh ch hàng như th nào, d
đo n khả năng hoàn trả vay hay không v c c khoản tín dụng. Đ
th c hiện vấn đ này, ng n hàng ti n hành thu thập thông tin v n
thuộc tín kh ch hàng (Tuổi t c, nơi cư tr , thu nhập, tài sản). Đ
giải uy t bài to n này là ng n hàng x c định đơn vay, kh ch hàng
nào được vay, hay ngược lại, kh ch hàng, đơn vay nào không được
duyệt vay.
Như vậy, giải uy t bài to n này, d liệu thu nhập đầu vào là
các thông tin liên uan đ n c nh n hoặc tổ ch c, công ty đ ng đơn
vay tín dụng, k t uả bài to n là uy t định cho vay hoặc không cho
vay; thông tin cần x lý là c c thông v c nh n, v s h u tài sản th
chấp, phương n kinh doanh
15
2.4. PHƯƠNG PHÁP GIẢI QUYẾT BÀI TOÁN
2.4.1. Phương pháp thủ công
Ng n hàng c c n bộ tín dụng thẩm định kh ch hàng.
C n bộ tín dụng sẻ ki m tra v tài sản, khi vay c th chấp,
hay phương n kinh doanh, hoặc độ tin cậy khi vay tín chấp bằng c c
thông tin (thông tin c c khoản vay tổ ch c kh c, cơ uan công t c,
c ch sống và uy tín tại địa phương nơi cư tr , tuổi t c)
Việc ki m tra thông được c n bộ tín dụng d a trên c c thông
tin người vay đi n vào mẫu c sẵn do ng n hàng ph t hành (Bao gồm
c c thông tin: Ngh nghiệp, ch c vụ, hệ số lương, năm công t c, tuổi
t c, giới tính, s c khỏe).
Trên cơ s c c thông tin cụ th c n bộ tín dụng, c n bộ tín dụng đ
xuất biệ ph p cụ th cho m i đơn vay.
2.4.2. Phương pháp thủ công và tin học
Đơn vay sau khi được xét duyệt cho vay, c n bộ tín dụng sẽ
chuy n toàn bộ hồ sơ đầy đ khi đ được thẩm định, đ n phòng
Quản lý nợ. C n bộ uản lý nợ sẽ ng dụng một phần m m tin học
được p dụng tại hệ thống Ngân hàng TMCP Ngoại Thương Việt
Nam.
Đối với kh ch hàng đ c thông tin trên hệ thống tin học thì
bước đầu tiên là c n bộ uản lý nợ khai b o m vay, l i suất, thông
tin ngày trả, trên chương trình cho vay c a ng n hàng, bao gồm c c
bước: B1: Khai báo mã vay; B2: Khai số hợp đồng; B3: Khai báo
thời gian trả gốc và l i, ngày tất to n; B4: Sau khi khai báo xong như
trên i m so t viên/ Trư ng/Ph phòng ki m tra duyệt, t nh n viên
uản lý nợ đ khai b o chuy n ua; B5: Sau khi khai báo xong như
trên/ki m tra như trên, một nh n viên uả lý nợ ti p tục s dụng một
chương trình hạch to n ti n cho kh ch hàng vào tài khoản hoặc nh n
16
ti n mặt. Quy trình tất to n, trả nợ, và trả lại cũng s dung chương
trình này.
Như vậy, việc ng dụng công nghệ thông tin cũng g p phần
giải uy t một lương lớn công việc ng n hàng. Tuy nhiên, n chưa
mang tính toàn vẹn, chỉ gi p một vài bộ phận nghiệp vụ trong ng n
hàng tăng hiệu su t làm việc lên một m c nào đ , chưa h trợ được
cho l nh đạo trong việc ra uy t định. Một khi lượng d liệu tăng lên
nhi u thì c c biện ph p này sẽ đ lộ ra một vài nhược đi m mà
nh ng nhược đi m đ , một kỹ thuật kh c c th giải uy t h t s c
nhanh ch ng và hiệu uả. Đ là kỹ thuật mạng Nơ-ron.
2.4.3. Phương pháp sử dụng K thu t mạng Nơ-ron
Việc s dụng c c biện ph p th công hay c c phương ph p
truy n thống sẽ tốn kém nhi u thời gian và công s c đ kinh doanh
ti n tệ nhưng hiệu uả không cao, c th không đạt như mong muốn.
T c c kỹ thuật, công nghệ mới trong tin học và truy n thông,
c c nhà khoa học đ nghiên c u, mô phỏng hoạt động và cấu tr c.
Việc mô phỏng hoạt động c a hàng tỉ Nơ-ron trong bộ n o người,
hoạt động song song đ tăng hiệu uả c a việc x lý lên gấp hàng
triệu lần. C như vậy, mới giải uy t hiệu uả được bài to n, đ p
ng s ph t tri n ngày một lớn mạnh c a hệ thống ng n hàng.
2.5. SỰ CẦN THIẾT PHẢI S DỤNG KỸ THUẬT MẠNG NƠ -
RON
C c phương ph p m y tính truy n thống trước đ y s dụng cơ
ch tuần t , phép to n này x lý xong mới đ n phép to n kh c.
ỹ thuật mạng Nơ-ron mô phỏng tính năng và cấu tr c c a hệ
thống thần kinh và n o người. Mạng Nơ-ron c th giải uy t lượng
d liệu lớn, x lý song song và cho ra k t uả chính x c giống như
k t uả x lý c a n o người.
17
Ng n hàng TMCP Ngoại Thương Việt Nam c trụ s chính tại
Hà Nội, c khoảng 77 chi nh nh cấp I 4 tỉnh, thành phố trên cả
nước và m i chi nh nh cấp I lại c c c phòng giao dịch địa bàn
uận, huyện.
M i ngày, trung bình một chi nh nh nhận được 50 đơn vay
vốn c a c c c nh n, hộ gia đình, công ty, ...
Một c n bộ tín dụng c công suất giải uy t tối đa là 4
đơn/1ngày.
Như vậy, số lượng c n bộ tín dụng c a hệ thống ng n hàng đ
trên cả nước sẽ là: (2.500 50) / 4 = 31.250 c n bộ.
R ràng rằng, với bộ m y cồng k nh như vậy, chưa k c c bộ
phận phòng ban kh c thì hiệu uả kinh doanh sẽ giảm r rệt. T đ dẫn
đ n s c cạnh tranh kém, kh khăn trong việc đi u hành và ph t tri n.
đ y chưa đ cập đ n r i ro xảy ra khi c n bộ tín dụng, n u
thi u c c kinh nghiệm thẩm định mà chấp nhận đơn vay một c ch d
dàng thì x c suất r i ro c a việc cho vay không thu hồi được vốn sẽ
tăng lên.
Đối mặt với khối lượng công việc ngày càng lớn, đ ng trước
s cạnh tranh khốc liệt gi a c c ng n hàng và việc lôi cuốn, gi ch n
kh ch hàng bằng chất lượng dịch vụ và marketting c a mình, không
còn c ch nào kh c là c c ng n hàng phải t vươn lên, tìm mọi biện
ph p đ n ng cao chất lượng dịch vụ. Trong đ , s làm hài lòng
kh ch hàng và đảm bảo y u tố thành công trong kinh doanh và giảm
thi u c c r i ro là nh ng vấn đ then ch t, uan t m hàng đầu c a
c c cấp l nh đạo.
Việc p dụng c c kỹ thuật và công nghệ m y tính nhằm tăng
năng suất làm việc, tăng độ bảo mật thông tin kh ch hàng Do đ ,
việc p dụng c c ng dụng đ d b o thẩm định vay vốn c a c c
18
ng n hàng tại Việt Nam hoàn toàn c tính khả thi. Đi u này sẽ c
nhi u mặt lợi:
Tăng hiệu suất công , Thống nhất v công nghệ. Liên doanh,
liên k t đ giảm chi phí đầu tư, tăng khả năng cạnh tranh đối với c c
doanh nghiệp, tập đoàn nước ngoài.
Vì vậy, p dụng kỹ thuật mạng Nơ-ron trong d b o thẩm định
vay vốn ng n hàng sẽ ch a đ ng một ti m năng to lớn v hiệu uả
ng dụng c a n . i p tăng cường khả năng d b o, h trợ đ c l c
cho c c cấp l nh đạo ng n hàng ra uy t định trong công t c đi u
hành công việc.
Trong c c chương ti p theo, ch ng ta sẽ cùng xem xét c c kh i
niệm, ki n th c chung v khai ph d liệu, c c kỹ thuật p dụng
trong khai ph d liệu và tìm hi u cặn kẻ v kỹ thuật mạng Nơ-ron,
c c thuật to n học, hàm truy n c a kỹ thuật này cũng như việc cài
đặt ng dụng cụ th minh họa cho phần ki n th c đ nghiên c u.
Kết lu n chương 2
Việc x c định c c yêu cầu đặt ra c a bài to n, ta ti n hành
ph n tích và đưa ra c c giải ph p đ giải uy t c c yêu cầu c a bài
to n. T đ ch ng ta chọn ra một phương ph p tối ưu là d a vào kỹ
thuật mạng nơron đ giải uy t bài to n và x c định c c vấn đ cần
nghiên c u được chỉ ra.
CHƯƠNG 3
XÂY DỰNG HỆ THỐNG TRỢ GIÚP THẨM ĐỊNH VAY VỐN
TẠI NGÂN HÀNG
Trên cơ s tìm hi u kỹ thuật mạng Nơ-ron như đ trình bày,
trong phần này, ch ng ta sẽ trình bày giải ph p đ x y d ng mạng
Nơ-ron nhằm giải uy t bài to n đ đặt ra: Trợ giúp thẩm định đ n
vay vốn ngân hàng.
19
D a vào cơ s thuật to n lan truy n ngược (Back propagation
algorithm), ch ng tôi cải ti n thêm một vài bước nhằm đạt được c c
yêu cầu như dưới đ y:
dụng thuật to n Lan truy n ngược c cải ti n, k t hợp
thêm c c y u tố:
– dụng hàm học logic g(u)
– Hàm kernel: m rộng cho c c hàm uy t định phi
tuy n, tăng số lớp ẩn lên > 1
iảm thời gian học (huấn luyện) c a mạng
Tốc độ hội tụ c a mạng nhanh hơn
Các bước tổng quát để cài đ t một mạng Nơ-ron:
(1) Chọn ki n tr c mạng. Với bước chọn ki n tr c mạng nào
sẽ uy t định thuật to n học nào đi k m theo.
(2) Chọn số lớp ẩn. ố lớp ẩn c th là 0, 1, 2, 3, 4.
(3) Với m i lớp ra và m i lớp ẩn, chọn thuật to n học.
u ý: Trong một số trường hợp, số lượng lớp ẩn c th bị
ràng buộc b i việc chọn thuật to n học. Việc chọn số lớp ẩn th hiện
bằng đường nét rời. Với thuật to n này thì số lớp ẩn chỉ duy nhất là
một lớp.
(4) Tất cả c c tham số kh c là độc lập và c th được cung cấp
vào bất kỳ l c nào. C c tham số c th phụ thuộc vào việc chọn thuật
to n học nào cho mạng.
ể xây dựng m t ng d ng c c c sau là cần thiết:
Trước tiên, ta chọn ki n tr c mạng, sau đ chọn ki u x lý c c
phần t trong mạng. i n tr c mạng sẽ uy t định c ch th c x lý
c c phần t được k t nối như th nào. t uả c a đầu ra sẽ được
đi u chỉnh b i việc chọn trọng số trong u trình k t nối. C c bước
chọn l a trên c th t m lược lại như sau:
20
(1) c định nhiệm vụ cần th c hiện c a mạng Nơ-ron trong
ng dụng; (2) Ph n tích d liệu phù hợp cho ng dụng; (3) Chọn c c
đầu vào c a ng dụng; (4) lý d liệu một c ch thích hợp trước
khi đưa vào mạng; (5) Chọn c c yêu cầu đầu ra c a mạng, bao gồm
cả việc bổ sung c c x lý c a c c đầu ra s dụng trong ng dụng; ( )
Chọn phương ph p học và thuật to n học s dụng cho u trình huấn
luyện; ( ) c lập c c tham số đi theo với mạng được chọn, bao gồm
cả số phần t x lý trong m i lớp, ki u x lý c c phần t và c c tham
số học; (8) Huấn luyện mạng Nơ-ron trong tập d liệu huấn luyện;
( ) i m tra việc huấn luyện c a mạng trên tập i m th ; (10) Ph n
tích k t uả và việc huấn luyện lại c a mạng hoặc cài đặt lại c c
tham số, c c bước ti n x lý; (11) Tích hợp việc huấn luyện mạng
vào ng dụng.
3.1. CHỌN MÔI TRƯỜNG CÔNG CỤ
D a vào cơ s lý thuy t c a chương 1 và bài to n trong
chương 2 tôi x y d ng chương trình hệ thống trợ giúp thẩm định vay
vốn tại Ngân hàng TMCP Ngoại Thương Quảng Bình.
Chương trình x y d ng trên n n tảng Dot.net và cơ s d liệu
được thu thập tại Ngân hàng TMCP Ngoại Thương Quảng Bình.
3.2. TẠO DỮ LIỆU M U CHO ỨNG DỤNG
Tất cả c c thông tin v kh ch hàng vay được lưu tr trong hệ
thống tập tin (Trong CSDL SQL, Fox) trong hệ chương trình giao
dịch c a Ngân hàng TMCP Ngoại Thương Quảng Bình.
Tuy nhiên tất cả c c thông tin này phải được lam sạch loại bỏ
nhưng thông tin dư th a cho việc kha ph d liệu, d liệu sẽ được tổ
ch c lại và khai ph theo usy và năm t đ p dụng kỷ thuật mạng
nơron x y d ng hệ thống trợ gi p d b o độ r i ro hoàn trả nợ c a
đơn vay tín dụng.
21
Nh ng thông tin sau là cần thi t cho việc khai ph d liệu:
Tuổi, hôn nh n, gia đình, ngh nghiệp, thời gian làm việc, tài khoản,
s h u nhà, tình trạng tài khoản...
D liệu bao gồm khoảng 450 – 500 bản ghi. C c bản ghi bao
gồm c c thuộc tính đầu vào như: Tuổi, giới tính, tình trạng hôn nh n,
ngh nghiệp, tài khoản, s h u tài sản, c c lần vay tín dụng trước,
khả năng chi trả và thuộc tính đầu ra: Độ r i ro c a đơn vay.
Trong trường hợp th nghiệm này, ch ng tôi s dụng bộ d
liệu c a ng dụng gồm (300 ban ghi): Tập d li u đầu vào (300 ản
ghi); Tập d li u uấn luy n ( 0 ản ghi ; Tập d li u iểm thử
(55 ản ghi ;Tập d li u ết uả
Trong đ VLD: bản ghi được huấn luyện ua mạng; TRN: bản
ghi thuộc tập mẫu huấn luyện; T T: bản ghi thuộc tập mẫu ki m th
C c bản ghi đ y hoàn toàn c th thay đổi tính chất t TRN
sang T T hoặc là bản ghi c a d liệu đầu vào.
C c gi trị đ y c th thay đổi tùy theo bài to n. ố lượng
mẫu trong tập huấn luyện và ki m th c th thay đổi bất kỳ l c nào.
3.3. CÀI Đ T THUẬT TOÁN
Mục tiêu là x c định độ r i ro c a việc cho vay c a một đơn
vay tín dụng. Việc x c định độ r i ro này d a trên c c thông tin được
cung cấp k m theo với đơn vay.
Việc cho vay một khoản ti n hay toàn bộ số ti n c a một đơn
vay nào đ chính là việc ph n lớp c a ng dụng mạng Nơ-ron. Đ
giải uy t vấn đ này, một mạng Nơ-ron sẽ được huấn luyện đ th c
hiện việc ph n lớp một c ch chính x c c c đơn vay. au khi mạng
Nơ-ron đ được huấn luyện, n c th được s dụng đ h trợ việc ra
uy t định cho vay toàn bộ hoặc một phần hay t chối một đơn vay
theo k t uả mà mạng Nơ-ron đ được huấn luyện chỉ ra.
22
D liệu được lấy t một cơ s d liệu và ch a c c thông tin
chọn lọc t mẫu đơn vay vốn.
Trong ng dụng này, thuật to n Lan truy n ngược
(Backpropagation algorithm) được s dụng đ cài đặt.
Qu trình giải uy t một bài to n tối ưu được gọi là lan truy n
ngược, n bao hàm cả việc tính to n l i c a mạng Nơ-ron và lan
truy n ngược l i ấy thông ua mạng đ cập nhật lại c c trọng số. Qu
trình ấy bao gồm c c bước sau:
Thuật to n huấn luyện cho một mẫu trong tập d liệu huấn
luyện; Thuật to n huấn luyện cho tất cả c c mẫu trong tập d liệu
huấn luyện; Thuật to n tính trọng số cho lớp ra; Thuật to n tính trọng
số cho lớp ẩn; Thuật to n cập nhật trọng số.
3.3.1 Xử lý mẫu
Thu t toán Lan truyền ngược (Trường hợp cho một mẫu trong tập
d liệu huấn luyện)
3.3.2 Cài đ t thu t toán lan truyền ngược xử lý t p huấn
luyện
3.3.3 C p nh t các trọng số
Mô tả trong thuật to n c a lan truy n ngượcn, sau khi c c trọng
số được cập nhật, c c mẫu ti p theo được s dụng đ tính to n đầu
ra, tính to n c c l i, tính to n cập nhật c a c c trọng số. Và sau đ ,
m i trọng số được cập. Qu trình huấn luyện k t th c khi l i (hoặc
l i bình phương tổng u t hoặc l i trong tập c c gi trị cơ bản) hạ
đ n m c đ thấp, hay đạt được c c tham số ti n định c a mạng.
3.4. HU N LUYỆN KI M TH VÀ KẾT QUẢ
D liệu cho c c tập huấn luyện và ki m th đ được trình bày.
au khi chạy th cho chương trình huấn luyện mạng. t uả ta c
tập d liệu k t uả.
23
Trong th nghiệm này, c c thông tin v d liệu như sau: D
liệu vào: 300 bản ghi; D liệu trong tập mẫu huấn luyện: 180 bản
ghi; D liệu trong tập mẫu ki m th : 5 bản ghi; D liệu được huấn
luyện: 55 bản ghi
t uả huấn luyện mạng cho ra đ y chính là trường
RuiRoTD. Trường này c hai khả năng là r i ro CA hay TH P.
3.5. ĐÁNH GIÁ VỀ GIẢI PHÁP
Như vậy, trên cơ s thuật to n lan truy n ngược, ch ng tôi đ
xuất cải ti n thuật to n bằng c ch s dụng hàm logic và hàm kernel
nhằm đạt được c c mục tiêu như sau: iảm thời gian học c a mạng.
Tăng tốc độ hội tụ c a mạng.. Hơn n a, việc gia tăng số lượng lớp ẩn
sẽ tăng độ tin cậy c a k t uả d b o.
Kết lu n chương 3
Trong chương này, ch ng ta đ tìm hi u c c bước cần thi t đ
x y d ng một ng dụng mạng Nơ-ron. Theo đ , ta phải chọn ki n
tr c mạng, thuật to n học phù hợp với yêu cầu c a bài to n. Ti p
theo là chọn số lớp ẩn c a mạng (đi u này phụ thuộc vào việc ta
chọn thuật to n học nào). Bên cạnh đ , ta cũng sẽ x c định hàm
truy n cho mạng cũng như c c tham số cần thi t kh c.
Chương 3 cũng trình bày u trình x y d ng một ng dụng.
ng dụng này được x y d ng trên cơ s cải ti n thuật to n lan truy n
ngược nhằm r t ng n thời gian học c a mạng, tăng tốc độ hội tụ c a
mạng cũng như m rộng phạm vi p dụng cho c c hàm phi tuy n.
Bằng kỹ thuật lập trình Dot.net trên n n tảng indo s, chạy
m y đơn, khai th c cơ s d liệu uan hệ m c độ v a phải trên hệ
uản trị ( l erver, Fpxpro). Mục tiêu c a ng dụng là nhằm th
nghiệm c c ki n th c đ tìm hi u trong phần lý thuy t. Qua đ xem
xét khả năng m rộng c a ng dụng sau này.
24
ng dụng đ th hiện cụ th c c nguyên t c lý thuy t đ tri n
khai một mạng Nơ-ron cho công việc cụ th , đ là tìm ra c c đơn vay
tín dụng c th cho vay hoặc không cho vay nhằm h trợ l nh đạo
trong việc ra uy t định.
KẾT LUẬN VÀ HƯỚNG PHÁT TRI N
Luận văn đ trình bày tổng uan và c c nét đặc trưng nhất
trong lĩnh v c khai ph tri th c d liệu bao gồm c c vấn đ cần kh m
ph tri th c, c c hướng ti p cận và nghiên c u tiêu bi u.
C c kỹ thuật khai ph tri th c d liệu s dụng trong luận văn
được tham khảo t nhi u nguồn tài liệu kh c nhau. Tuy nhiên, ch ng
c nét tương đồng với nhau, th hiện việc c c kỹ thuật đ u cần tập
c c trọng số phù hợp kỹ thuật mạng Nơ-ron.
Kết quả nghiên cứu của lu n văn cho ph p rút ra những
kết lu n sau đây:
Việc ng dụng kỹ thuật mạng Nơ-ron trong khai ph d liệu
đ n ng cao được hiệu năng c a mô hình, giảm được chi phí trao đổi
trong hệ thống. C c thuật to n c a mạng Nơ-ron c th p dụng cho
nhi u lĩnh v c kinh t , kỹ thuật, văn ho kh c nhau, tùy theo yêu cầu,
m c độ c a m i lĩnh v c mà p dụng c c thuật to n, phương ph p
kh c nhau cho phù hợp. Như vậy, sẽ gi p mang lại hiệu uả công
việc cao hơn.
V mặt cài đặt th nghiệm, luận văn giới thiệu kỹ thuật khai
phá tri th c t d liệu theo thuật to n lan truy n ngược đ p dụng
vào bài toán trợ gi p thẩm định vay vốn ng n hàng.
Hướng phát triển: Nghiên c u s u c c thuật to n khai ph
d liệu; y d ng c c thuật to n kh c c a kỹ thuật mạng Nơ-ron đ
tăng m c độ và phạm vi ng dụng c a chương trình; y d ng c c
phương ph p, thuật to n kh c nhau theo hướng mô đun thành phần
và tích hợp vào ng dụng.
Các file đính kèm theo tài liệu này:
- nguyentransy_tt_9952.pdf