Lời nói đầu
Nhân lọai ngày nay đang chứng kiến sự phát triển mạnh mẽ của ngành
Công nghệ Thông tin, một trong những nghành mũi nhọn của nhiều quốc gia trên
thế giới. Sự phát triển vượt bậc của nó là kết quả tất yếu của sự phát triển kèm theo
các thiết bị phần cứng cũng như phần mềm tiện ích.
Sự phát triển đó đã kéo theo rất nhiều nghành khác phát triền theo, trong đó
có lĩnh vực nghiên cứu khoa học. Tuy công nghệ ngày càng phát triển, tốc độ xử
lý của các thiết bị cũng không ngừng tăng cao, nhưng nhu cầu tính toán của con
người vẫn còn là rất lớn. Hiện nay vẫn còn rất nhiều vấn đề mà các nhà khoa học
cùng với khả năng tính toán của các máy tính hiện nay vẫn chưa giải quyết được
hay giải quyết được nhưng với thời gian rất lớn.
Các vấn đề đó có thể có thể là :
ã Mô hình hóa và giả lập
ã Xử lý thao tác trên các dữ liệu rất lớn
ã Các vấn đề “grand challenge” (là các vấn đề không thể giải quyết trong
thời gian hợp lý)
Lời giải cho những vấn đề này đã dẫn đến sự ra đời của các thế hệ siêu máy
tính. Tuy nhiên việc đầu tư phát triển cho các thiết bị này gần như là điều quá khó
khăn đối với nhiều người, tổ chức, trường học . Chính vì lẽ đó mà ngày nay
người ta đang tập trung nghiên cứu cách cách sử dụng các tài nguyên phân bố một
cách hợp lý để tận dụng được khả năng tính toán của các máy tính đơn. Những
giải pháp này được biết đến với nhiều tên gọi khác nhau như meta-computing,
salable-computing, global- computing, internet computing và gần nhất hiện nay là
peer to peer computing hay Grid computing.
Đây là phương pháp nhằm tận dụng khả năng của các máy tính trên toàn
mạng thành một máy tính “ảo” duy nhất, nhằm hợp nhất tài nguyên tính toán ở
nhiều nơi trên thế giới để tạo ra một khả năng tính toán khổng lồ, góp phần giải quyết các vấn đề khó khăn trong khoa học và công nghệ. Ngày nay nó đang
càng được sự hỗ trợ mạnh hơn của các thiết bị phần cứng, băng thông
Grid Computing có khả năng chia sẻ, chọn lựa, và thu gom một số lượng
lớn những tài nguyên khác nhau bao gồm những siêu máy tính, các hệ thống lưu
trữ, cùng với những nguồn dữ liệu, các thiết bị đặt biệt Những tài nguyên này
được phân bố ở các vùng địa lý khác nhau và thuộc về các tổ chức khác nhau.
153 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 2382 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Nghiên cứu tính toán lưới và thực nghiệm trên một số thuật toán lý thuyết đồ thị, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hêm các tham số trong thủ tục
như sau nhằm để quản lý các tiến trình gửi
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 104
Request object : Kiểu dữ liệu MPI_Request
Ý nghĩa :
Nonblocking communication sử dụng đối tượng request để yêu cầu đối
tượng nhận diện những họat động truyền thông và liên kết với những thao tác xem
xét sự hoàn thành của tác vụ. Đối tượng request được định rõ vị trí trong bộ nhớ
hệ thống MPI. Người dùng không biết đến cấu trúc của những đối tượng này.
Chương trình ứng dụng chỉ vận dụng thẻ điều khiển (handle) đối tượng. Hệ thống
có thể dùng đối tượng request này để xác định một số thuộc tính khác của những
thao tác truyền thông, chẳng hạn như bộ đệm truyền thông liên quan đến nó, hay
để lưu trữ thông tin về những về trạng thái chưa được giải quyết của các họat động
truyền thông (gửi ,nhận).
4.3.3.1. Non-Blocking Send
Tương tự các Blocking Send hay Receive của blocking communication,
nhưng tên hàm còn có thêm chữ “I” phía trước.
MPI_Isend(void* buf, int count, MPI_Datatype datatype, int dest, int tag,
MPI_Comm comm, MPI_Request *request)
MPI_Issend (void *buf,int count,MPI_Datatype datatype,int dest,int
tag,MPI_Comm comm,MPI_Request *request)
Giống như MPI_Isend(), ngoại trừ hàm MPI_Wait() hoặc MPI_Test chỉ ra
rằng khi nào thì xử lý đích đã nhận được thông điệp.
MPI_Ibsend (void *buf,int count,MPI_Datatype datatype,int dest,int
tag,MPI_Comm comm,MPI_Request *request)
Giống như MPI_Bsend() ngoại trừ MPI_Wait() hay MPI_Test chỉ ra rằng
xử lý đích đã nhận được thông điệp hay chưa. Hàm này phải được sử dụng với
hàm MPI_Buffer_attach.
MPI_Irsend(void *buf,int count,MPI_Datatype datatype,int dest, int
tag,MPI_Comm comm,MPI_Request *request)
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 105
Giống như MPI_Rsend() ngoại trừ MPI_Wait() hay MPI_Test() chỉ ra rằng
khi nào thì xử lý chính nhận thông điệp. Chỉ nên sử dụng nếu lập trình viên chắc
chắn rằng có một trình nhận thông điệp thích hợp ở xử lý đích đã được đưa lên.
4.3.3.2. Non-Blocking Receive
MPI_Irecv(void* buf, int count, MPI_Datatype datatype, int source, int tag,
MPI_Comm comm, MPI_Request *request)
thêm vào đối tượng có kiểu dữ liệu MPI_Request dùng để trả về thẻ điều khiển.
Và thẻ này dùng trong các trường hợp chờ trạng thái hoàn thành của các Posting
Operations, quản lý tiến trình nhận và gửi thông điệp.
Lưu ý rằng bộ đệm gửi và bộ đệm nhận sẽ không được truy xuất khi các
Posting Operations đã được thực hiện cho đến khi nó hoàn thành.Nếu truy xuất bộ
đệm ứng dụng trong khi các thao tác gửi và nhận chưa hòan thành thì sẽ gây ra dữ
liệu bị sai.
Chằng hạn, khi hệ thống bắt đầu sao chép dữ liệu ra khỏi bộ đệm gửi thì
không được truy xuất những phần của bộ đệm này cho đến khi nhận giá trị trả về
của hệ thống thực thi gửi thông điệp, tương tự truy xuất cho thao tác nhận.
4.3.3.3. Kiểm tra sự hoàn thành của các tiến trình nhận
Bởi vì các hàm trong Posting Operation không được biết trước sự hoàn
thành khi được khởi chạy. Nên MPI cung cấp chức năng chờ cho đến khi thao tác
Send và Receive đã hoàn thành. Nếu thao tác non blocking Send và Receive có
thêm các thao tác chờ sự hoàn thành thì giống như hàm blocking.
Có thể hình dung như thế này
MPI_Isend()+MPI_Wait() = = MPI_Send()
MPI_Irecv()+MPI_Wait() = = MPI_Recv()
Phân loại kiểu kiểm sự hoàn thành trong truyền thông
Blocking
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 106
Kiểm tra sự hoàn thành của các tiến trình gửi hoặc nhận và dùng lại các
thông tin liên quan đến các đối tượng này, chủ yếu là vùng nhớ ứng dụng dùng để
gửi dữ liệu .Các hàm do MPI cung cấp có tên Wait.
Non-blocking :
Chỉ kiểm tra xem đã hoàn thành 1 tác vụ hay chưa, hàm này trả về ngay
tại thời điểm đó. Và nếu tác vụ đã hoàn thành thì trả về thêm các thông tin liên
quan đến sự hoàn thành đó ,ngược lại trả về một giá trị không định nghĩa .Các hàm
này mang tên Test
MPI_Wait(MPI_Request *request,MPI_Status *status)
Chờ cho đến khi tiến trình nhận thông điệp nhận được thông điệp hoàn
toàn ,thông qua thẻ điều khiển request liên quan đến tiến trình nhận thông điệp. Và
biến status sẽ nhận được trạng thái của tiến trình nhận như định danh thông điệp
v.v...
MPI_Test (MPI_Request *request,int *flag,MPI_Status *status)
Gọi hàm MPI_Test, flag trả về bằng true nếu thao tác gửi hoặc nhận được
xác định bằng đối tượng request đã hoàn thành. Trong trường hợp này, đối tượng
trạng thái status được thiết lập nội dung thông tin trên thao tác đã hoàn thành và
đối tượng request sẽ được gán giá trị MPI_REQUEST_NULL. Ngược lại, flag trả
về bằng false. Trong trường hợp này, giá trị của đối tượng trạng thái status là
không xác định.
Cả hàm MPI_Wait và MPI_Test, thông tin trả về thao tác hoàn thành đều
dựa trên thông tin đối tượng trạng thái status. Nội dung của đối tượng trạng thái
status. Nếu muốn chờ một tập các truyền thông giữa các tiến trình hoàn thành thì
dùng các hàm sau
MPI_ Waitany(int count,MPI_Request *arrayofrequest,int
*index,MPI_Status *status)
Khóa một thao tác truyền thông (gửi hoặc nhận), liên kết với một đối tượng
request trong mảng các đối tượng Request. Nếu nhiều hơn hay bằng một thao tác
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 107
đã hoàn thành, thì MPI_Waitany tùy ý lấy một đối tượng request trong mảng đó
và hoàn thành nó, MPI_Waitany sẽ trả về chỉ số của phần tử request trong mảng
và trả về trạng thái hoàn thành. Đối tượng request đó sẽ được giải phóng và được
gán giá trị MPI_REQUEST_NULL
MPI_Testany(int count,MPI_Request *array_of_requests,int *index,int
*flag,MPI_Status *status)
Nếu có một hay nhiều hơn một thao tác đã hoàn thành, nó trả về flag=true,
và chỉ số của đối tượng request trong mảng đối tượng Request, và trạng thái của
thao tác đó và đối tương trạng thái đó được giải phóng và gán giá trị
MPI_REQUEST_NULL. Ngược lại, flag=false, và index=MPI_UNDEFINED và
status=MPI_UNDEFINED, các giá trị này do MPI định nghĩa dùng trong trường
hợp các giá trị trả về không thích hợp.
MPI_ Waitall(int count,MPI_Request *arrayofrequest,MPI_Status
*arrayofstatus)
Chờ cho đến khi tất cả các thao thác có đối tượng request trong mảng
Request hoàn thành. Chỉ số trạng thái thứ i trong mảng các trạng thái trả về trạng
thái hoàn thành thứ i của thao tác. Và tất cả các đối tương trong mảng đối tượng
Request được giải phóng và được gán giá trị MPI_REQUEST_NULL,
MPI_Testall(int count,MPI_Request *array_of_request,int
*flag,MPI_Status *array_of_statuses)
Nếu tất cả các thao tác đã hoàn thành thì flag=true,và trả về trạng thái status
tương ứng trong mảng các trạng thái, giải phóng toàn bộ các đối tượng request và
được gán giá trị là MPI_REQUEST_NULL,
MPI_ Waitsome(int incount,MPI_Request *arrayofrequest,int *outcount,int
*offsets,MPI_Status*arrayofstatuses)
Chờ cho đến khi nhiều hơn một truyền thông được hoàn thành ,liên kết với
những đối tượng request trong mảng .MPI_Waitsome trả về số lượng đối tượng
request đã hoàn thành.
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 108
MPI_Testsome(int incount,MPI_Request *array_of_request,int
*outcount,int *array_of_indices,MPI_Status *array_of_statuses)
Cũng như hàm MPI_Waitsome,ngọai trừ nó trả về ngay lập tức. Nếu không có
thao tác nào hoàn thành thì outcount=0
MPI_Iprobe(int source,int tag,MPI_Comm comm,int *flag,MPI_Status
*status)
Là hàm thuộc dạng non-blocking, trả về flag=true nếu có một thông điệp mà có
thể được nhận với những thông tin đặc tả về source, tag,comm. Lời gọi cũng
tương thích cùng thông điệp mà đã được nhận với hàm MPI_Recv(với những tham
số như thế này).
4.3.3.4. Các thủ tục liên quan đến đối tượng request
Giải phóng Request(Freeing Requests)
Một đối tượng request có thể được giải phóng dựa vào các hàm
MPI_Wait hay MPI_Test.Ngòai ra ,nó còn dược giải phóng bởi sử dụng những
thao tác khác như:
MPI_Request_free(MPI_Request *request)
Nhưng các thao tác này không giải phóng được đối tượng request khi có
một sự giao tiếp liên quan đến đối tượng này vẫn tồn tại .Vì thế MPI cung cấp
thêm một hàm nữa là :
MPI_Cancel(MPI_Request *request)
Đánh dấu cho việc hủy bỏ thao tác truyền thông nonblocking (gửi hay
nhận) đang bị treo. Nó trả về ngay lập tức, có thể trước khi sự thao tác đó bị
hủy bỏ. Sau này, nó sẽ tiếp tục hoàn thành sự truyền thông mà đã đánh dấu hủy
bỏ. Cũng giống như các hàm MPI_IRecv(..). Hàm này cũng có thể áp dụng các
hàm liên quan đến việc chờ đợi như MPI_Wait(..) để biết hàm này đã thực hiện
xong hay chưa. Nếu sự truyền thông không bị hủy bỏ (bởi vì sự truyền thông
đã xảy ra trước khi hàm này tỏ ra hiệu quả ), ngược lại thì đối tượng request sẽ
được giải phóng và trả về trạng thái thông tin đã bị hủy bỏ bằng cách sử dụng
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 109
hàm MPI_Test_cancelled(MPI_Status *status,int *flag): status lưu thông tin
của thao tác cần kiểm tra xem có phải thao tác này đã bị hủy bỏ hay chưa.
flag=true nếu xảy ra điều đó, ngược lại flag=false.
4.4. Trao đổi thông tin tập hợp
4.4.1. Đồng bộ hóa
MPI_Barrier (MPI_Comm comm)
Tạo ra một rào cản đồng bộ trong một nhóm. Mỗi tác vụ, khi tiến tới
lời gọi MPI_Barrier, thì khóa lại cho đến khi nào tất cả các tác vụ khác
trong nhóm cũng tiến tới cùng một lời gọi MPI_Barrier. Chức năng này
giúp tất cả các xử lý trong nhóm đã nhận hết được dữ liệu.
4.4.2. Di dời dữ liệu trong nhóm
MPI_Bcast(void *buffer,int count,MPI_Datatype datatype,int
root,MPI_Comm comm)
Broadcast (gửi) một thông điệp từ xử lý với rank=root tới tất cả các
xử lý còn lại trong cùng một communicator (trong cùng một nhóm với
nhau)
Các xử lý trong một communicator sẽ nhận dữ liệu của tiến trình gửi
broadcast
Tham số Diễn giải
Buffer địa chỉ của bộ đệm ứng dụng
Count Số lượng thực thể trong buffer
Datatype Dạng dữ liệu của buffer
Root Rank của xư lý gọi Broadcast
Comm Communicator _phạm vi ảnh hường
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 110
Hình 4-10 : Broadcast dữ liệu
MPI_Scatter(void *sendbuff,int sendcnt,MPI_Datatype sendtype,void
*recvbuf,int recvcnt,MPI_Datatype recvtype,int root,MPI_Comm comm)
Phân phối và chia nhỏ thông điệp thành n phần khác nhau từ một xử
lý nguồn và gửi đến mỗi xử lý còn lại trong communicator. Hàm này giống
như gồm n hàm MPI_Send với n là số tiến trình và mỗi tiến trình đều thực
hiện hàm MPI_Recv(...) . Tất cả các tham số đều quan trong với tiến trình
gửi Broadcast, còn lại các tiến trình khác chỉ quan tâm bộ đệm nhận,
communicator, tiến trình gửi, dạng dữ liệu và số dữ liêu được nhận.
Cho phép một số lượng dữ liêu được gửi đến mỗi tiến trình, bởi vì
sendcount là một mảng và còn có thêm một tham số nữa là mảng displs
dùng để quy định các địa chỉ của sendbuf được chia ra như thế nào.
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 111
Hình 4-11 : Ví dụ hàm Scatter
Sự mở rộng của hàm Scatter là: MPI_Scatterv(void *sendbuf,int *sendcounts,int
*displs,MPI_Datatype sendtype,void *recvbuf,int recvcount,MPI_Datatype
recvtype,int root,MPI_Comm comm)
Trái ngược với các hàm MPI_Scatter thì gồm các hàm sau đây
MPI_Gather(void *sendbuff,int sendcnt,MPI_Datatype sendtype,void
*recvbuf,int recvcount,MPI_Datatype recvtype,int root, MPI_Comm
comm)
Hàm này có nhiệm vụ lấy lại tất cả các thông điệp từ mỗi tác vụ
trong một nhóm vào một tác vụ đích duy nhất.
Mỗi xử lý (kế cả xử lý ở root) đều phải gửi thông tin về sendbuf đến
tiến trình root,và tiến trình root sẽ nhận thông điệp và lưu chúng trong một
danh sách có thứ tự các định danh tiến trình (rank) .
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 112
Hình 4-12 : Hàm MPI_Gather
MPI_Allgather(void *sendbuf,int sendcount,MPI_Datatype sendtype,void *
recvbuf,int recvcount,MPI_Datatype recvtype,MPI_Comm comm)
Cũng giống như hàm MPI_Gather(...) ngoại trừ là tất cả các tiến
trình tham gia đều có giá trị thay vì chỉ một tiến trình root sau khi thực
hiện gather. Kết qủa của hàm gọi MPI_Allgather(..) cũng như là tất cả các
tiến trình thực thi hàm MPI_Gather và đều nhận được kết quả như nhau
Hình 4-13 : Hàm MPI_Allgather
MPI_Alltoall(void *sendbuf,int sendcount,MPI_Datatype sendtype,void
*recvbuff,int *recvcount,MPI_Datatype recvtype,MPI_Comm comm)
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 113
là một sự mở rộng của hàm MPI_Allgather. Mỗi xử lý sẽ gửi dữ liệu phân
biệt đến mỗi trình nhận.Xử lý thứ i sẽ gửi khối thứ j đến xử lý thứ j và được
thay thế trong khối thứ i của bộ nhớ lưu trữ nhận
Hình 4-14 : Hàm MPI_Alltoall
4.4.3. Tính toán gộp
Các hàm ở dạng này cung cấp thêm tính toán gộp trên các xử lý với nhau
(ví dụ như tính tổng ,tính giá trị lớn nhất...) các gía trị thuộc về các thành viên
của nhóm xử lý . Cũng giống như các hàm collective operation khác, những
hàm này cũng có hai dạng, đó là kết quả tính toán trả về trên một nút hoặc kết
quả tính toán trả về trên nhiều nút (nút ở đây xem như là một xử lý hay một
máy trên một mạng)
MPI_Reduce(void *sendbuf,void *recvbuf,int count,MPI_Datatype
datatype,MPI_Op op,int root,MPI_Comm comm)
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 114
Tính giá trị của tất cả các tiến trình trong communicator gửi đến và sau đó đưa
giá trị tính toán đó về một tiến trình có rank=root.
Hình 4-15 : Hàm MPI_Reduce
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 115
4.4.3.1. Một số kiểu tính toán do MPI cung cấp
CÁC THỦ TỤC TÍNH TOÁN KIỂU DỮ LIỆU ĐƯỢC SỬ
DỤNG
MPI_MAX Tính giá trị lớn nhất integer,float
MPI_MIN Tính giá trị nhỏ nhất integer,float
MPI_SUM Tính tổng integer,float
MPI_PROD product integer,float
MPI_LAND Toán tử luận lý AND integer
MPI_BAND Toán tử dấu bit AND integer,MPI_BYTE
MPI_LOR Toán tử luận lý OR integer
MPI_BOR Toán tử dấu bit OR integer,MPI_BYTE
MPI_LXOR Toán tử luận lý XOR integer
MPI_BXOR Toán tử dấu bit XOR integer,MPI_BYTE
MPI_MAXLOC Tính giá trị lớn nhất và
thêm thông tin rank
của tiến trình chứa giá
trị lớn nhất
integer,double,vaø long double
MPI_MINLOC Tính giá trị nhỏ nhất
và thêm thông tin rank
của tiến trình chứa giá
trị nhỏ nhất
integer,double,vaø long double
4.4.3.2. Một số kiểu tính toán do người dùng định nghĩa
Để viết một hàm với chức năng do người dùng định nghĩa dựa vào thuật
toán của hàm MPI_Reduce cung cấp có thể thực hiện theo 3 bước sau :
Kiểm tra phương pháp tính toán có phù thuộc vào những yêu cầu sau đây
không?
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 116
Bước 1: Có tính kết hợp
Ví dụ a + (b+c)=(a+b)+c
Có tính giao hoán
Ví dụ a+b=b+a
Bước 2 : bổ sung toán tử vào hàm gộp (reduction) theo quy tắc sau
Hàm myfunc(void *in,void *inout,int *len,MPI_Datatype *datatype)
Bước 3 : Đăng ký hàm này với MPI
int commute,myop;
commute=1
MPI_Op_create(myfunc,commute,&myop)
MPI_Reduce(...,myop,..)
Hình 4-16 : Sử dụng 8 xử lý để tính giá trị tuyệt đối
Một số hàm tính toán gộp còn lại :
MPI_Allreduce(void *sendbuf,void *recvbuf,int count,MPI_Datatype
datatype,MPI_Op op,MPI_Comm comm)
Cũng giống như hàm MPI_Reduce nhưng tất cả các xử lý trong cùng một
communicator sẽ nhận giá trị tính toán được
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 117
Hình 4-17 Hàm Mpi-Allreduce
MPI_Reduce_scatter(void *sendbuf,void *recvbuf,int
recvcount,MPI_Datatype datatype,MPI_Op op,MPI_Comm comm)
MPI_Reduce_scatter thực hiện hai bước. Bước thứ nhất là dùng tính
toán gộp trên mỗi giá trị từ bộ đệm gửi (và dĩ nhiên là mỗi giá trị này sẽ lưu
trong một mảng). Sau đó mảng này sẽ được phân chia ra thành n đoạn (với n
là số xử lý ). Đoạn thứ i sẽ chứa giá trị thứ i trong mảng đã tính toán. Và đoạn
thứ i sẽ được gửi đến xử lý thứ i và lưu trong bộ đệm nhận.
Hình 4-18 : Hàm MPI_Reduce_scatter
MPI_Scan(void *sendbuf,void *recvbuf,int count,MPI_Datatype
datatype,MPI_Op op,MPI_Comm comm)
MPI_Scan(...) được sử dụng để thực hiện một dạng tính toán gộp theo kiểu
Reduction ở trên nhưng với tiến trình i, kết quả sẽ là thực hiện tính toán gộp
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 118
trên các tiến trình từ 0 dến i. Hình vẽ sau đây sẽ minh họa rõ hơn về điều
này
Hình 4-19 : Hàm MPI_Scan
4.5. Các kiểu dữ liệu
4.5.1. Những kiểu dữ liệu đã được định nghĩa
Kiểu dữ liệu của MPI Kiểu dữ liệu của C
MPI_CHAR signed char
MPI_SHORT signed short int
MPI_INT signed int
MPI_LONG signed long int
MPI_UNSIGNED _CHAR unsigned char
MPI_UNSIGNED_SHORT unsigned short int
MPI_UNSIGNED unsigned int
MPI_UNSIGNED_LONG unsigned long int
MPI_FLOAT float
MPI_DOUBLE double
MPI_LONG_DOUBLE long double
MPI_BYTE
MPI_PACKED Kiểu dữ liêu khác
MPI_BYTE khác với MPI_CHAR, với một số máy tính thì MPI_CHAR có thể
là một ký tự 8 bit (1 byte), nhưng một số máy khác thì MPI_CHAR có thể là
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 119
một ký tự 2 byte (16 bit _mã Unicode chẳng hạn) còn giá trị của MPI_BYTE là
số 1 byte (8 bit) trong tất cả các trường hợp.
Tất cả các kiểu dữ liệu còn lại gần giống với các kiểu dữ liệu của C .Ngoài
ra còn có thêm kiểu dữ liệu MPI_Packed ,một dạng dữ liệu nén mà chúng ta sẽ
đề cập sau
4.5.2. Các kiểu dữ liệu bổ sung
Ngoài những kiểu dữ liêu do MPI cung cấp như
MPI_BYTE,MPI_DOUBLE v.v…thì MPI còn cung cấp khả năng cho việc
định nghĩa chính cấu trúc dữ liệu dựa trên các dạng dữ liệu chính. Những cấu
trúc do người dùng định nghĩa được gọi là dạng dữ liệu bổ sung.
MPI cung cấp một số phương pháp cho việc cấu trú những kiểu dữ liệu sau
đây :
+ Contiguous
+ Vector
+ Indexed
+ Struct
4.5.2.1. Contiguous
Cấu trúc đơn giản nhất .Sản sinh ra một dạng dữ liệu mới bằng cách tạo
một số lượng những bản sao chép của một dạng dữ liệu đã có
MPI_Type_contiguous(in count,in oldtype, out *newtype)
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 120
Hình 4-20 : MPI_Type_contiguous
4.5.2.2. Vector
MPI_Type_vector(int count,int blocklenght,int stride, MPI_Datatype oldtype,
MPI_Datatype*newtype)
Cũng giống như contiguous, nhưng cho phép khoanh vùng dữ liệu muốn
đăc tả .MPI_Type_hvector cũng giống như MPI_Type_vector ngoại trừ phạm
vi được đặc tả ở dạng byte
IN :
count : số lượng block
blocklenght : số lượng của những thành phần bên trong mỗi block
stride : số lượng của những thành phần giữa vị trí bắt đầu của mỗi block
oldtype : dạng dữ liệu cũ (handle)
OUT :
newtype : dạng dữ liệu mới
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 121
Hình 4-21 : MPI_Type_vetor
4.5.2.3. Indexed
Định nghĩa dữ liệu không liên tục ,khoảng cách không cố định và đều đặn.
Hàm được sử dụng là
MPI_Type_indexed(int count,int []blocklens,int []indices,MPI_Datatype
old_type,MPI_Datatype *newtype)
Dạng dữ liệu tạo ra theo chỉ số của mảng dữ liệu đầu vào và vùng mảng
được đặc tả
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 122
Hình 4-22 : MPI_Type_indexed
4.5.2.4. Struct
Vấn đề đặt ra là MPI không cho truyền dữ liệu bằng kiểu cấu trúc .Do đó
,lập trình viên phải định nghĩa cấu trúc sau đó đặt tả cầu trúc đó theo dạng byte
theo sự trợ giúp của các hàm MPI .
MPI_Type_struct (int count,int []blocklens,int[]offsets,MPI_Datatype
oldtypes,MPI_Datatype *newtype)
Hình 4-23 : MPI_Type_struct
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 123
Các hàm liên quan khác đến dạng dữ liệu bổ sung :
MPI_Type_extent(MPI_Datatype,MPI_Aint* extent)
Trả về kích thước của dạng dữ liệu được đặc tả.Trả về kích thước
theo dạng BYTE.
MPI_Type_commit( MPI_Datatype datatype)
Đăng ký dạng dữ liệu mới với hệ thống. Đây là hàm yêu cầu cho tất
cả các hàm tạo ra kiểu dữ liệu mới trước khi sử dụng
4.5.3. Pack và UnPack
Cung cấp những chức năng cho việc truyền nhận dữ liệu không liên tục .
Ứng dụng sẽ nén dữ liệu vào một bộ đệm liên tục trước khi gửi di .và giải nén
sau khi nhận được .
Hai hàm thường sử dụng cho việc nén và giải nén là
MPI_Pack(void* inbuf, int incount, MPI_Datatype datatype, void *outbuf,
int outsize, int *position, MPI_Comm comm)
MPI_Pack nén thông điệp với nội dung thông điệp là inbuf,
incount,datatype,comm vào không gian bộ đệm (với thông tin outbuf và
outsize).
Bộ đệm vào (inbuf) có thể là bất kỳ bộ đệm truyền thông (mà được cho phép
trong giao tiếp gửi MPI_SEND) và dữ liệu ra (output buffer) là một vùng lưu
trữ liên tục chứa outsize bytes, bắt đầu với địa chỉ outbuf
MPI_Unpack(void* inbuf, int insize, int *position, void *outbuf, int
outcount, MPI_Datatype datatype, MPI_Comm comm)
Ngược lại với chức năng của hàm MPI_Pack ,MPI_Unpack giải nén một thông
điệp được đặc tả thông tin ( giá trị inbuf,kích thước insize) vào bộ đệm nhận
được đặt tả với thông tin (giá trị outbuf,kích thước outsize, dạng dữ liệu
datatype) .Bộ đệm đầu ra thuộc bất kỳ dạng dữ liệu nào được truyền thông
trong hàm nhận MPI_Recv. Bộ đệm đầu vào (input buffer) là dạng dữ liệu liên
tục chứa insize bytes, bắt đầu với địa chỉ của ìnbuf
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 124
Việc phân biệt ngữ nghĩa giữ kiểu dữ liệu bổ sung và kiểu dữ liệu
MPI_PACKED rất khó .Tuỳ theo ngữ cảnh mà người dùng tự chọn cho mình
cách biểu thị tốt nhất cho bài toán tối ưu về mặt ngữ nghĩa và truyền thông
trong các thuật toán cụ thể
4.6. Quản lý nhóm và communicator
4.6.1. Tổng quan
Nhắc lại, Group là một tập hợp có thứ tự các xử lý. Mỗi xử lý trong một
nhóm là một sự kết hợp với một rank duy nhất. Gía trị Rank trong phạm vi từ 0
đến N-1, trong đó N là số xử lý trong nhóm. Bên trong MPI, một Nhóm đại diện
bên trong bộ nhớ hệ thống như một đối tượng. Người lập trình truy xuất đó như
một ‘handle’. Một nhóm luôn luôn liên kết với một đối tượng communicator.
Một Communicator đặt trưng cho một nhóm các xử lý cái mà sẽ giao tiếp
với các nhóm khác. Tất cả thông điệp phải đặt tả một communicator. Trong trường
hợp đơn giản nhất, một communicator là một ‘tag’ mở rộng cái mà bao gồm với
những lời gọi MPI. Giống như những nhóm, những communicators được thể hiện
bên trong hệ thống bộ nhớ như những đối tượng và những lập trình viên chỉ truy
xuất bằng các ‘handle’. Ví dụ,handle của một communicator mà quản lý tất cả các
tác vụ là MPI_COMM_WORLD
Mục tiêu chính của Group và những đối tượng Communicator:
• Cho phép tổ chức tác vụ, dựa trên chức năng, vào trong những nhóm tác
vụ. Làm cho những thao tác Collective Communication có thể thực
hiện liên kết một tập các tác vụ liên quan.
• Cung cấp nền tảng cho mô hình vật lý ảo do người dùng dịnh mô phỏng
(virtual topology)
• Cung cấp sự giao tiếp an toàn dữ liệu khi truyền nhận do sử dụng tối ưu
các thuật toán liên quan trên một communicator Group và
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 125
Communicator là tự động, chúng có thể được tạo và hủy bỏ trong suốt
sự thực thi của chương trình
Những xử lý có thể xuất hiện nhiều hơn trên một group
/communicator.Chúng sẽ có một rank duy nhất trong mỗi group /communicator
MPI cung cấp trên r ất nhiều hàm liên quan đến group, communicator
Communicator là một đối tượng không rõ ràng, với một số thuộc tính, và một số
quy tắc đơn giản. A Communicator đặc tả miền truyền thông có thể được sử dụng
cho sự truyền thông point-to-point. Intracommunicator được sử dụng cho truyền
thông bên trong một nhóm của những xử lý trong nhóm đó .Intracommunicator
cũng được sử dụng cho những collective operations
Một intercommunicator được sử dụng cho truyền thông điểm điểm (point-
to-point) giữa những nhóm xử lý tách rời nhau.Những thuộc tính của môt
intercommunicator là hai nhóm .Không có virtual topology nào (sẽ đề cập sau)
liên kết với một intercommunicator
Chức năng Intracommunicator Intercommunicator
Số nhóm 1 2
An toàn giao tiếp Có Có
Collecitve
Communication
Có Không
Topologies Có Không
Group Management (Sự quản lý nhóm)
Mô tả sự vận dụng những nhóm xử lý bên trong MPI. Những thao tác
này là local và sự thực thi của nó không yêu cầu sự giao tiếp giữa các xử lý.
MPI cho phép sự vận dụng những nhóm bên ngoài những communicator
nhưng những nhóm chỉ có thể được sử dụng cho truyền thông điệp bên trong
một communicator
Communicator management(Sự quản lý communicator)
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 126
Mô tả sự vận dụng của những communicator bên trong MPI.Những
thao tác này truy xuất communicators cái mà local và những sự thực thi của
nó không yêu cầu sự giao tiếp giữa các xử lý .Những thao tác này tạo ra
những communicator chung và có thể yêu cầu giao tiếp giữa các xử lý.
Chúng ta mô tả những cư xử của những hàm này, thừa nhận rằng tham số
comm là một intracommunicator
4.6.2. Nguyên tắc sử dụng
1. Mở rộng handle của nhóm cha từ MPI_COMM_WORLD bằng cách sử
dụng MPI_Comm_group
2. Tạo ra một nhóm mới như một tập con của nhóm cha bằng cách sử dụng
MPI_Group_incl
3. Tạo ra một communicator mới cho mỗi nhóm mới bằng cách sử dụng
MPI_Comm_create
4. Xác định rank mới trong communicator mới bằng cách sử dụng
MPI_Comm_rank
5. Thực hiện giao tiếp các communicator sử dụng các hàm MPI Messsage
pasing
6. Khi kết thúc ,giải phóng communicator mới và group mới tạo với hàm
MPI_Comm_free và MPI_Group_free
Group
Tạo group
MPI_Comm_group (MPI_Comm comm ,*group): Xác định group
liên kết với một communicator cho trước
MPI_Group_excl(MPI_Group group,int n,int *rank,MPI_Group
*newgroup): Phát sinh ra một nhóm bằng các sắp xếp lại một nhóm đã có
và chỉ lấy những thành viên chưa được lệ kê trong danh sách
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 127
MPI_Group_incl(MPI_Group group,int n,int
*ranks,MPI_Group*newgroup) : Phát sinh một nhóm bằng các sắp xếp lại
một nhóm sẵn có và chỉ lấy những thành viên được liệt kê trong danh sách
MPI_Group_intersection(MPI_Group group1,MPI_Group
group2,MPI_Group*newgroup): Phát sinh ra một nhóm là giao của hai
nhóm cho trước với nhau
MPI_Group_union(MPI_Group group1,MPI_Group
group2,MPI_Group*newgroup):Giống như MPI_Group_intersection nhưng
là hợp của hai nhóm
MPI_Group_difference(MPI_Group group1,MPI_Group
group2,MPI_Group *newgroup) :Tạo ra một nhóm mới từ hiệu của hai
nhóm cho trước
Truy xuất group
MPI_Group_rank(MPI_Group group,int *rank):Trả về rank của xử
lý này bên trong một group cho trước ,hay trả về MPI_UNDEFINED nếu
xử lý không phải là một thành viên
MPI_Group_size (MPI_Group group,int *size) : Trả về số lượng xử
lý của một group
Lưu ý :
Mỗi rank phải là một rank hợp lệ trong group và tất cả các thành
phần phải được phân biệt hay chức năng là không lỗi
MPI_Group_compare(MPI_Group group1,MPI_Group group2,*result):
So sánh hai nhóm và trả về một số integer ,số này là MPI_IDENT nếu trật tự
và những thành viên của hai nhóm là như nhau.MPI_SIMILAR nếu chỉ những
thành viên là như nhau ,và mặt khác là MPI_UNEQUAL
Huỷ group
MPI_Group_free(MPI_Group *group):Xác định group cho trước cần giải
phóng
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 128
Communicator
Tạo communicator
MPI_Comm_create(comm,group,*newcomm):Tạo mới một communicator
từ communicator cũ và nhóm mới
MPI_Comm_dup(MPI_Comm com,MPI_Comm *newcomm): Nhân đôi
một communicator đã có với tất cả thông tin được liên kết
Truy xuất communicator
MPI_Comm_size(MPI_Comm comm, int *size): Lấy số lượng (size) các
xử lý trong communicator
MPI_Comm_rank(MPI_Comm comm,int *rank): Lấy định danh của xử lý
bên trong một commmunicator ho trước
MPI_Comm_compare(MPI_Comm comm1,MPI_Comm comm2,*result)
So sánh hai communicator và trả về kết quả là một số integer. Nếu là
MPI_IDENT thì ngữ cảnh và n ững nhóm là như nhau.
MPI_CONGRUENT nếu có sự khác biệt về ngữ cảnh, MPI_SIMILAR nếu
sự khác biệt về ngữ cảnh nhưng giống nhau về group,và còn lại là
MPI_UNEQUAL
Huỷ communicator
MPI_Comm_free(MPI_Comm *comm): Giải phóng đối tượng
communicator
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 129
Chương 5. Thử nghiệm các thuật toán lý thuyết đồ thị
5.1. Các khái niệm cơ bản
5.1.1. Đồ thị
Một đồ thi G=(V,E) trong đó V là tập các đỉnh của đồ thị,E là tập các
cạnh của đồ thị ,mỗi cạnh sẽ là sự liên kết của hai đỉnh
Chỉ đề cập đến hai loại đồ thị là :
Đồ thị vô hướng :nếu những cạnh không có thứ tự hai chiều
Hai đỉnh u và v trong một đồ thị vô hướng G được gọi là liền kề hay( láng
giềng ) nếu u ,v là một cạnh của G .Nếu e=(u,v) thì e được gọi là cạnh liên
thuộc với các đỉnh u và v . Cạnh e cũng được gọi là ạnh nối các đỉnh u và v.
Các đỉnh u và v được gọi là các điểm đầu mút của cạnh (u,v)
Đồ thị hữu hướng khi cạnh có hai chiều nối hai đỉnh khác nhau
Khi (u,v) là cạnh của đồ thị có hướng G , thì u được gọi là nối tới v ,và v được
gọi là được nối từ u . Đỉnh u gọi là đỉnh đầu , đỉnh v gọi là đỉnh cuối của cạnh
(u,v). Đỉnh đầu và đỉnh cuối của khuyên là trùng nhau
Một đồ thị trọng số là đồ thị có độ dài cho mỗi cạnh
Ký hiệu :G(V,E, w)
Ma trận liền kề : A=(ai,j) ,là một mảng 2 chiều với thông tin như sau
nếu cạnh (i,j) tồn tại thì ai,j=1(hay độ dài của cạnh ) ngược lại thì ai,j=0
5.1.2. Đường đi
Đường đi từ đỉnh u đến đỉnh v là một tập thứ tự các đỉnh
,trong đó v0=v và vk=v và (vi,vi+1) thuộc tập cạnh E với mọi i từ 0 đến k
Chiều dài của đường đi là tổng giá trị độ dài các cạnh
Đường đi (u,v):
Nếu đường đi tồn tại , u tiến tới v
Đơn giản nếu tất cả các đỉnh trung gian đi qua là phân biệt
Là khuyên nếu vo=vk
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 130
G là đồ thị liên thông nếu có một đường đi từ một đỉnh đến bất kỳ các đỉnh còn
lại
5.2. Dijkstra
5.2.1. Tuần tự
Thuật toàn do E.Dijkstra ,nhà toán học người Hà Lan , đề xuất vào năm
1959 .
Các bước thực hiện thuật toán Dijkstra:
Đầu tiên gán cho đỉnh α nhãn bằng 0 và các đỉnh khác là ∞ .Ta ký hiệu
L(α)=0 và L(v)= ∞ cho tất cả các đỉnh khác ( bước lặp thứ 0 ). Các nhãn
này là độ dài của đường đi ngắn nhất từ đỉnh α tới các đỉnh này., trong đó
đường đi này chỉ chứa đỉnh α. (Vì không có đường đi từ α tới các đỉnh
khác α nên ∞ là độ dài đường đi ngắn nhất giữa α và các đỉnh này). Theo
thuật toán Dijkstra ta sẽ xây dựng tập đặc biệt các đỉnh. Gọi Sk là tập này
sau bước lặp thứ k của thủ tục gán nhãn. Chúng ta bắt đầu bằng So=Φ. Tập
Sk được tạo thành từ Sk-1 bằng cách thêm vào đỉnh u không thuộc Sk-1 có
nhãn nhỏ nhất. Khi đỉnh u được gộp vào Sk chúng ta sửa đổi nhãn của các
đỉnh không thuộc Sk sao cho Lk(v),nhãn của v tại bước k, là độ dài của
đường đi ngắn nhất từ α tới v mà đường đi này chỉ chứa các đỉnh thuộc Sk
(tức là các đỉnh đã thuộc tập đặc biệt các đỉnh cùng với u)
Giả sử v là một đỉnh không thuộc Sk. Để sửa nhãn của v ta thấy Lk(v) là độ
dài của đường đi ngắn nhất từ α tới v và chỉ chứa các đỉnh thuộc Sk. Để
sửa đổi nhãn ta lưu ý rằng đường đi ngắn nhất từ α tới u ở bước k-1 cùng
với cạnh (u,v). Nói cách khác ta có.
L(a,v)=min(Lk-1(a,v),Lk-1(a,u)+ w(u,v))
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 131
Thủ tục này được lặp bằng cách liên tiếp thêm các đỉnh vào tập đặc biệt các
đỉnh cho tới khi đạt tới đỉnh z. Khi thêm z vào tập đặc biệt các đỉnh thì
nhãn của nó bằng độ dài của đường đi ngắn nhất từ α tới z.
Sau đây là một minh dụ cụ thể thực hiện thuật toán Dijkstra trên một đồ thị
vô hướng 6 đỉnh
Hình 5-1.1.
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 132
Hình 5-1.2.
Hình 5-1.3.
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 133
Hình 5-1.4.
Hình 5-1.5
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 134
Hình 5-1.6
Hình 5-1. Thuật toán Dijkstra tuần tự
5.2.2. Song song
Thuật toán Dijkstra tuần tự có rất nhiều điểm dễ song song hoá.Do đó thuật
toán này đã được các nhà lập trình song song hóa rất nhiều. Cụ thể sau đây là
cách song song hóa của thuật toán Dijkstra tuần tự.
Lúc này chúng ta nghĩ rằng không phẩi thực thi thuật toán trên một bộ xử lý
nữa mà phân phối các công việc khác nhau cho mỗi bộ xử lý khác nhau thực
hiện.Mỗi bộ xử lý sẽ đảm nhận một số đỉnh của đồ thị cùng với ma trận mô tả
quan hệ của các đỉnh đó với các đỉnh còn lại
• Triển khai thuật toán
p l à số bộ xử lý, n là số đỉnh của đồ thị
Mỗi bộ xử lý quản lý n/p số đỉnh
Nếu n/p dư lẻ thì P0 đến P n-2 sẽ quản lý n/p số đỉnh
Số đỉnh còn lại sẽ do P n-1 quản lý
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 135
Mỗi bộ xử lý sẽ lưu một ma trận với số cột là số đỉnh do chính Pi quản lý và số
dòng là n (tương ứng với số đỉnh của đồ thị) liên quan đến ma trận liền kề A
Tương ứng với các đỉnh đó sẽ gồm mảng mô tả độ dài trọng số của đỉnh
Li[]
Hình 5-2 : Thuật toán Dijkstra song song
Các bước thực hiện song song hoá như sau :
Bước 1:
Khởi tạo tập đỉnh Vt={r},L[k]=∞ ∀k ,L[r]=0;
Lấy dữ liệu từ tập tin
Phân chia dữ liệu trong ma trận trọng số A[][]đến các bộ xử lý .Với
mỗi bộ xử lý sẽ có một ma trận con tương đương với một ma trận
con của A nhận dữ liệu
Mỗi Pi ngoại trừ P0 sẽ lưu một mảng đỉnh riêng cho mình Vi
Bước 2:
Từ bộ xử lý master , P0 broadcast đỉnh được chọn là r đến các bộ xử
lý còn lại
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 136
Bước 3:
Lặp cho đến khi nào đỉnh đích đã được chọn
Mỗi Pi sẽ cập nhật mảng L[] với L[k]=Min[L[k],L(Selected)+
W(selectedV,k)] với mọi k thuộc về tập đỉnh Vi
Mỗi Pi sẽ tính toán Min Li=Min(trong số mảng Li)
Thực hiện việc tính Min trên tất cả các bộ xử lý và lấy giá trị nhỏ
nhất .Sau đó chọn được đỉnh có độ dài nhỏ nhất là SelectedV
P0 sẽ broadcast giá trị SelectedV đến các bộ xử lý còn lại
P0 sẽ đưa đỉnh được chọn vào tập Vt
5.2.3. Thực nghiệm chương trình
Phiên bản 1:
Giống như hình vẽ minh họa thuật toán Dijkstra song song.
Chương trình được viết dưới dạng C chuẩn trên Linux.Chương trình không
bao gồm các cấu trúc đồ thị mà lưu tất cả các thông tin đều bằng mảng,mục
đích cho việc truyền dữ liệu được nhanh và gọn hơn.
Chương trình được chia thành các ập tin sau đây:
Đọc dữ liệu từ tập tin
• ReadFile.h
• ReadFile.cpp
Định nghĩa dạng dữ liệu được truyền giữa các tiến trình trong ứng
dụng MPI
• Vector.h
• Vector.cpp
Chương trình chính
• Dijkstra.h
• Dijkstra.cpp
Phiên bản 2:
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 137
Chương trình này được phân chia rõ ràng nhiệm vụ của các nút trên môi
trường LAM. Chương trình được viết dưới dạng các đối tượng
Lớp Slave quản lý công việc của các nút
Lớp Smatter quản lý thông tin của đồ thị có nhiệm vụ , đọc thông tin từ tập
tin và phân phối thông tin đến các nút còn lại trên mạng.
Chương trình được chia thành các tập tin sau đây:
Cấu trúc đồ thị:
• Graph.h
• Graph.cpp
Quản lý công việc các nút:
• Slave.h
• Slave.cpp
Định nghĩa dạng dữ liệu được truyền giữa các tiến trình trong ứng dụng
MPI
• Vector.h
• Vector.cpp
Chương trình chính
• Dijkstra.h
• Dijkstra.cpp
Biên dịch chương trình:
Được đóng gói thành tập tin makefile
Tạo tập tin Makefile có nội dung như sau
all:Dijkstra
CC=mpic++
Dijkstra: Dijkstra.o Slave.o Vector.o Graph.o
#(CC) -o myapp Dijkstra.o Slave.o Vector.o Graph.o
Dijkstra.o: Dijkstra.cpp Dijkstra.h Slave.o Vector.o Graph.o
#(CC) -c Dijkstra.cpp Dijkstra.h Slave.o Vector.o Graph.o
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 138
Slave.o:Slave.cpp Slave.h Dijkstra.h
#(CC) -c Slave.cpp
Vector.o:Vector.cpp
#(CC) -c Vector.cpp
Graph.o:Graph.cpp
#(CC) -c Graph.cpp
Nếu đăng nhập với quyền sử dụng là root thì tập tin Makefile có nội dung
như trên ,nếu đăng nhâp với quyền sử dụng khác thì thay dấu # bằng dấu $.
Chuyển thư mục hiện hành sang thư mục chứa tập tin Makefile
Từ dòng lệnh của màn hình Console gõ #make
Thực thi chương trình
Sau khi biên dịch ,tập tin thực thi là Dijkstra
Đổi quyền đăng nhập khác root để sử dụng LAM.Ví dụ $user
Thực thi như sau :
$lamboot
$mpirun –np k Dijkstra
với k là số bộ xử lý của môi trường LAM
5.3. Prim
5.3.1. Tuần tự
Do Robert Prim đưa ra vào năm 1957, mặc dù ý tưởng cở bản của nó đã có
từ sớm hơn rất nhiều. Để thực hiện thuật toán Prim ,ta bắt đầu bằng việc chọn một
cạnh bất kỳ có trọng số nhỏ nhất, đặt nó vào cây khung. Lần lượt ghép vào cây và
không tạo ra chu trình trong cây. Thuật toán sẽ dừng khi n-1 cạnh đã được ghép
vào cây.
b1:
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 139
b2:
b
h
c
i
g
d
e
f
a
4
8 7
9
10
14
8
11
7
2
4
6
b3:
b4:
b5:
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 140
b6:
b7:
b
h
i
g
e
f
a
4
8 7
9
10
14
8
11
7
2
4
6
c d
b8:
b
h
i
g
e
f
a
4
8 7
9
10
14
8
11
7
2
4
6
c d
b9:
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 141
b
h
i
g
e
f
a
4
8 7
9
10
14
8
11
7
2
4
6
c d
Hình 5-3. Thuật toán Prim tuần tự
5.3.2. Song song
Do hai thuật toán Dijkstra và Prim gần giống nhau về mặt bản chất đó là
cùng tìm giá trị nhỏ nhất. Đối với Prim đó là cạnh có trọng số nhỏ nhất, còn đối
với Dijkstra là đỉnh có độ dài từ đỉnh nguồn đến nó nhỏ nhất. Nên về mặt song
song hóa thuật toán Prim cũng tương tự như thuật toán Dijkstra
• Triển khai thuật toán
p bộ xử lý ,n=số đỉnh của đồ thị
Mỗi bộ xử lý quản lý n/p số đỉnh
Nếu n/p dư lẻ thì P0 đến Pn-2 sẽ quản lý n/p số đỉnh
Số đỉnh còn lại sẽ do Pn-1 quản lý
Mỗi bộ xử lý sẽ lưu một ma trận với số cột là số đỉnh do chính Pi quản lý và số
dòng là n (tương ứng với số đỉnh của đồ thị) của ma trận liền kề A
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 142
Hình 5-3 : Thuật toán Prim song song
Các bước xử lý thuật toán :
Bước 1:
Khởi tạo tập đỉnh Vt={r},L[k]=∞ ∀k ,L[r]=0;
Lấy dữ liệu từ tập tin
Phân chia dữ liệu trong ma trận trọng số A[][]đến các bộ xử lý .Với mỗi bộ xử lý
sẽ có một ma trận con tương đương với một ma trận con của A nhận dữ liệu
Mỗi Pi ngoại trừ P0 sẽ lưu một mảng đỉnh riêng cho mình Vi
Bước 2:
Từ bộ xử lý master , P0 broadcast đỉnh được chọn là r đến các bộ xử lý còn lại
Bước 3:
Lặp cho đến khi nào đ ã c ó n đỉnh được chọn (với n là số đỉnh của đồ thị)
Mỗi Pi sẽ cập nhật mảng L[] với L[k]=Min[L[k],W(selectedV,k)] với mọi k thuộc
về tập đỉnh Vi
Mỗi Pi sẽ tính toán Min Li=Min(trong số mảng Li)
Thực hiện việc tính Min trên tất cả các bộ xử lý và lấy giá trị nhỏ nhất .Sau đó
chọn được đỉnh có độ dài nhỏ nhất là SelectedV
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 143
P0 sẽ broadcast giá trị SelectedV đến các bộ xử lý còn lại
P0 sẽ đưa đỉnh được chọn vào tập Vt
5.3.3. Thực nghiệm chương trình
5.4. Bellman – Ford
5.4.1. Tuần tự
Thuật toán Bellman – Ford giải quyết bài toán tìm đường đi ngắn nhất trong
trường hợp tổng quát hơn so với thuật toán Dijkstra , trong đó trọng số của các
cạnh nối có thể là số âm. Cho một đồ thị G=(V, E) có hướng và trọng số, với đỉnh
nguồn s và hàm trọng số w : E →R, thuật toán trả về giá trị kiểu boolean cho biết
từ đỉnh nguồn có thể đến được mạch âm hay không. Nếu có thì thuật toán sẽ kết
thúc mà không có lời giải, còn nếu không sẽ kết xuất tất cả các con đường ngắn
nhất cùng với chiều dài của chúng.
Giống như thuật toán Dijkstra, thuật toán Bellman – Ford cũng sử dụng kỹ
thuật relaxation, bằng cách ngày càng giảm chiều dài của đường đi ngắn nhất từ
đỉnh s đến các đỉnh v∈V cho đến khi đạt được giá trị ngắn nhất. Thuật toán trả về
giá trị TRUE khi và chỉ khi từ đỉnh gốc không đến được mạch âm.
BELLMAN-FORD(G, w, s)
INITIALIZE-SINGLE-SOURCE(G, s)
for i ←1 to |V[G]|-1
do for each edge (u, v) ∈E[G]
do RELAX(u, v, w)
for each edge (u, v) ∈E[G]
do if d[v] > d[u] + w(u, v)
then return FALSE
return TRUE
b1:
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 144
Hình a
b2
Hình b
b3
Hình c
b4
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 145
Hình d
b5
Hình e
Hình 5-4: Thuật toán Bellman-Ford tuần tự
Hình bên trên thể hiện thuật toán Bellman-Ford với 5 đỉnh. Sau khi
thực hiện phép khởi tạo thông thường, thuật toán thực hiện qua |V|-1 bước qua các
cạnh của đồ thị. Hình (b) và (e) cho thấy trạng thái của thuật toán sau mỗi bước.
Sauk hi thực hiện |V|-1 bước , thuật toán sẽ tiến hành kiểm tra mạch âm và trả về
giá trị Boolean thích hợp.
Thuật toán Bellman-Ford có chi phí là O(V,E), bởi chi phí cho việc
khởi tạo là O(V), còn từng bước sẽ tốn O(E), và dòng lặp cuối cùng cũng tốn chi
phí là O(E).
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 146
Để chứng minh tính đúng đắn của thuật toán, chúng ta sẽ chứng
minh là nếu đồ thị không chứa mạch âm thì có thể tính được đường đi ngắn nhất từ
đỉnh gốc đến mọi đỉnh còn lại.
Bổ đề
Cho G = (V, E) là một đồ thị có hướng và trọng số với đỉnh nguồn s
và hàm trọng số w : E →R, và giả sử trong G đỉnh s không tới được mạch âm. Do
đó khi kết thúc thuật toán, chúng ta có d[v] = δ (s, v) với mọi đỉnh v có thể đến từ
s.
Chứng minh
Gọi v là đỉnh có thể đến được từ s, và p = (k<=|V|-1)
là đường đi ngắn nhất từ s đến v, trong đó v0 = s và vk = v. Chúng ta sẽ chứng
minh baằng phương pháp quy nạp vớ i = 0, 1, …, k, chúng ta có d[vi] =δ (s, vi) sau
bước thứ i, và kết quả này vẫn được duy trì về sau. Bởi vì có |V|-1 bước, chúng ta
sẽ dùng kết quả này để chứng minh bổ đề
Sau bước khởi gán, chúng ta có d[v0] = δ (s, v0) = 0.
Trong bước quy nạp chúng ta giả sử đúng với trường hợp i-1, d[vv-1]
= δ (s, vi-1) theo bổ đề ở trên chúng ta kết luận được d[vi] = δ (s, vi) sau bước thứ
i, do đó bổ đề được chứng minh.
Hệ quả
Cho G = (V, E) là một đồ thị có hướng và trọng số với đỉnh nguồn s
và hàm trọng số w : E →R. Với mỗi đỉnh v∈V, tồn tại một đường đi từ s đến v khi
và chỉ khi thuật toán Bellman-Ford kết thúc với d[v]<∞
Chứng minh
Chứng minh tương tự như bổ đề.
Định lý (Tính đúng đắn của thuật toán Bellman-Ford)
Thực hiện thuật toán Bellman-Ford trên đồ thị G = (V, E) có hướng
và trọng số với đỉnh nguồn s và hàm trọng số w : E →R. Nếu từ s không đến được
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 147
mạch âm trong G, thuật toán trả về giá trị TRUE, và ta có d[v] = δ (s, v) với mọi
đỉnh v∈V, ngược lại trả về giá trị FALSE.
Chứng minh
Giả sử trong đồ thị G, từ đỉnh s không đến được mạch âm. Trước
tiên chúng ta sẽ chứng minh tại thời điểm kết thúc, d[v] = δ (s, v) với mọi đỉnh
v∈V. Nếu từ s đến được đỉnh v, thì định lý đã cho là đúng với bổ đề trên. Bây giờ
chúng ta sẽ sử dụng phát biểu trên để chứng minh thuật toán BELLMAN-FORD
trả về giá trị TRUE. Khi kết thúc chúng ta có tất cả các cạnh (u, v) ∈E.
d[v] = δ (s, v)
≤ δ (s, u) + ω (u, v)
= d[u] + ω (u, v)
Do đó theo như mô tả trong thuật toán, giá trị trả về là TRUE.
5.4.2. Song song
Mô tả chương trình
Như đã đề cập ở trên ta có 2 khái niệm cần được phân biệt rõ, là xây dựng
chương trình song song từ một thuật toán song song cụ thể đã được thực nghiệm
và kiểm tra tính đúng đắn, còn một cách khác để cài đặt một chương trình song
song là tiến hành song song hóa các phần trong chương trình tuần tự. Trong thực
tế, phần lớn người ta thường sử dụng cách thứ hai do việc thiết kế ra một thuật
toán song song là điều rất khó khăn và cần nhiều thời gian làm việc.
Chương trình song song cài đặt thuật toán Bellman-Ford được dùng ở đây
là tiến hành theo cách thứ hai như đề cập phần trên.
Đặc điểm chương trình:
o Số bộ xử lý tham gia là biến động tùy thuộc vào người sử dụng.
o Nội dung ma trận kề của đồ thị được nhận vào từ tập tin.
o Có thể thay đổi các tham số của chương trình như : đỉnh nguồn, đỉnh
đích, tên tập tin nhập liệu.
Thực hiện
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 148
Quy ước :
+ ta có thể hiểu khái niệm tiến trình ở đây là trên một bộ xử lý, số
lượng các tiến trình tham gia cũng là số bộ xử lý cần có (cũng là số máy trạm nếu
trên một máy chỉ có một bộ xử lý).
+ P là ma trận gồm 2 dòng, có số cột bằng với số đỉnh của đồ thị,
dùng để lưu đường đi ngắn nhất.
+ L là ma trận kề lưu nội dung của đồ thị.
Các bước thuật toán
b1: khởi tạo ma trận P và L.
b2: tiến trình chính gửi cho các tiến trình con một số cột của ma trận L, tùy
vào số máy để chạy chương trình.
b3: tiến trình chính broadcast 1 dòng của ma trận P, rồi nhận lại P sau khi
các tiến trình con thực hiện tính toán, chương trình kết thúc khi:
2 dòng của ma trận P tương tự nhau, lúc đó kết luận từ đỉnh nguồn có thể đến được
mạch âm, bài toán kết thúc mà không có lời giải.
Khi số lần thực thi bước 3 lớn hơn số đỉnh của đồ thị, chương trình kết xuất đường
đi ngắn nhất từ đỉnh nguồn đến các đỉnh còn lại theo như trong ma trận P.
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 149
Tieán trình chính
Tieán trình 1 Tieán trình 2 Tieán trình chính
Broadcast 1 doøng cuûa P
Nhaän laïi P sau khi caùc tieán trình con tính tính toaùn
Tieán trình chính
Tieán trình 1 Tieán trình 2 Tieán trình chính
Hình 5-5 : Thuật toán Bellman-Ford song song
Thực hiện
+ Ma trận P được lưu theo lớp TMatrixRow (tổ chức ma trận theo mảng các
phần tử được đánh số theo dòng rồi theo cột)
class TMatrixRow
{
public:
void printMatrix();
void init(unsigned int mLen, unsigned int nLen);
TMatrixRow(unsigned int mLen, unsigned int nLen);
void freeMatrix();
unsigned int m; //number of rows
unsigned int n; //number of columns
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 150
double *data; //data, ordered by row, then by column
double **rows; //pointers to rows in data
TMatrixRow();
virtual ~TMatrixRow();
};
+ Ma trận L được lưu theo lớp TMatrixCol(tổ chức ma trận theo mảng các
phần tử được đánh số theo cột rồi theo dòng)
class TMatrixCol
{
public:
void init(unsigned int len);
void printMatrix();
void freeMatrix();
int read(char* filename);
unsigned int n; //number of rows = number of columns
double *data; //data, ordered by column, then by row
double **cols; //pointers to cols in data
TMatrixCol();
TMatrixCol(unsigned int len);
virtual ~TMatrixCol();
};
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 151
Chương 6. Kết luận – Hướng phát triển
6.1. Kết luận
Dựa trên các kiến thức đã tìm hiểu được về tính toán lưới, cách thức lập
trình trên môi trường song song và phân tán, cũng như các môi trường hỗ trợ phát
triển, đề tài đã đat được mục tiêu đề ra là nghiên cứu về tính toán lưới và thực
nghiệm trên một số thuật toán lý thuyết đồ thị.
Mặc dù thời gian thực hiện có hạn, bên cạnh đó gặp phải một số khó khăn
trong việc triển khai ứng dụng, do đây là một đề tài khá mới ít được quan tâm phát
triển trước đây, nhưng chúng em cũng cố gắng thực hiện để đạt được các yêu cầu
đề ra.
Các chương trình viết ra đều có khả năng thực hiện trên nhiều máy với số
máy xử lý tùy biến và thực hiện đúng kết quả cần thiết.
Chúng em hy vọng sẽ tiếp tục cải tiến chương trình, tối ưu các thuật toán để
đạt được kết quả tốt nhất, tận dụng được sức mạnh của các máy con để giải quyết
vấn đề. Bên cạnh đó, chúng em cũng hy vọng có thể triển khai trên các hệ thống
lớn hơn.
6.2. Hướng phát triển
Tương lai của tính toán song song và phân bố, và xa hơn nữa là tính toán
lưới vẫn còn rất lớn. Trên thế giới hiện nay người ta vẫn đang tiếp tục nghiên cứu
mạnh mẽ nhằm có thể tận dụng được khả năng của các hệ thống máy tính lớn trên
thế giới, góp phần trong công tác nghiên cứu khoa học cũng như thương mại.
Do trong thời hạn cho phép cũng như khả năng và kiến thức hiện nay vẫn chưa
thực sự phát huy được hết khả năng của tính toán lưới, vì thế đề tài hiện còn khả
năng phát triển rất lớn.
• Cải tiến chương trình
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 152
Tìm hiểu sâu hơn về thư viện MPI để phát huy tiềm năng rất lớn của nó,
bên cạnh đó cũng cần thực hiện một số phương pháp tối ưu như giảm chi phí do
tính toán, truyền tải thông tin…Bên cạnh đó nếu có điều kịện sẽ sử dụng trên môi
trường hỗ trợ tính toán lưới phổ biến nhất hiện nay là Globus.
• Triển khai thực tế
Do hạn chế về cơ sở vật chất nên các chương trình chưa được triển khai
trên các hệ thống lớn, thực tế để qua đó có thể đánh giá đúng được khả năng của
chương trình. Do đó chúng em hy vọng có thể tiếp tục phát triển được đề tài để tận
dụng được sức mạnh của tính toán lưới, đem lại hiệu quả cao trong công tác
nghiên cứu khoa học và áp dụng vào thực tế.
ht
t
p
:
/
/
e
t
r
i
t
h
u
c
.
v
n
Trang 153
Tài liệu tham khảo
Tài liệu viết:
[1] Wolfgang Gentzsch, Grid Computing : A New Technology for the Advanced
Web, Sun Microsystem Inc, 2001
[2] Ananth Gramma, Anshul Gupta, George Karypis, Vipin Kumar : Introduction
to Parallel Computing 2nd, Addison Wesley, USA, 2003
[3] Behrooz Parhami, Introduction to Parallel Processing Algorithms and
Architectures, Kluwer Academic, 2002
[4] Fran Berman, Anthony J.G.Hey, Geoffrey C.Fox, Grid Computing Making the
Global Infrastructure a Reality, Wiley, 2003
[5] IBM RedBooks, Introduction to Grid Computing with Globus, 2003
[6] Graeme S.McHale, Parallel Programming on Linux Networks Using MPI &
PVM
[7] Mark Baker, Rajkumar Buyya, Domenico Laforenza, Grids and Grid
technologies for wide-area distributed computing, Software – Practice and
Experience, 2002
[8] 7.1.1 Lam Install ,LAM/MPI Team Open Systems LAb
[9] 7.1.1 Lam User Guide,LAM/MPI Team Open Systems LAb
Website:
[10] Global Grid Forum,
[11] Ian Foster, Designing and Building Parallel Programs, 1995,
[12]
[13]
[14]
[15]
[16] Application of Parallel Computers
[17]
Các file đính kèm theo tài liệu này:
- Nghiên cứu tính toán lưới và thực nghiệm trên một số thuật toán lý thuyết đồ thị.pdf