สารพันรูปแบบไฟล์เพลง ภาค Lossy แถมตั้ง mp3 ยังไงถึงจะแหล่ม
บทความนี้ตีพิมพ์ในนิตยสาร PCtoday ฉบับที่ 45 เดือนมกราคม ปี 2551 ครับ แต่เห็นว่ามีประโยชน์เลยเอาฉบับเต็มมาให้อ่านในนี้ด้วย-------
ในเย็นวันศุกร์ หลังจากผ่านวันอันแสนวุ่นวายมาตลอดสัปดาห์ ผมตั้งใจว่าจะปล่อยใจล่องลอยให้ผ่อนคลายไปกับเสียงเพลงของวงดนตรีสุดโปรด เราเองก็จัดแจงซื้อซีดีเพลงมาเรียบร้อย ขณะกำลังเตรียมแปลงเพลงเป็น mp3 (rip) ลง notebook อยู่นั้น (เค้าเรียกว่าหวงแผ่น CD จะได้ไม่ต้องใช้แผ่นบ่อยๆ ให้เป็นรอย) ก็เกิดสงสัยว่าเราจะทำไฟล์ออกมาแบบไหนดี ตั้งค่ายังไงขนาดมันถึงจะเล็กแล้วเสียงยังดีอยู่
-------
ผมสงสัยเรื่องนี้มานานพอสมควร เพราะมันมีรูปแบบไฟล์เยอะเหลือเกินตั้งแต่ mp3, ogg, aac, flac, wavpack แล้วรูปแบบไหนที่มันดีสำหรับเรากัน แล้วควรจะตั้งค่ามันยังไง ตั้ง kbps เท่าไหร่ เสียงถึงจะเดิ้น ด้วยความอยากรู้ผมจึงไปค้นข้อมูลมาอ่าน แล้วก็นำมาเล่าสู่กันฟังครับ แหะๆ บทความนี้อาจจะซับซ้อนแล้วก็เต็มไปด้วยเรื่องทางวิทยาศาสตร์นะครับ เพราะเสียงคือวิทยาศาสตร์สาขาหนึ่ง ผมจะพยายามเขียนให้เข้าใจง่ายที่สุด แต่ถ้าขี้เกียจอ่านเรื่องพื้นฐานยุ่งๆ ของมัน ก็ข้ามไปอ่านสรุปของแต่ล่ะส่วน (ย่อหน้าสุดท้าย) ได้เลยครับ แต่ผมก็สนับสนุนให้รู้พื้นฐานไว้ด้วยจะดีมาก เพราะจะได้นำไปประยุกต์ใช้ได้กว้างขึ้น เอาแหละเรามาเริ่มกันที่เรื่องพื้นฐานของเสียงกันก่อนดีกว่าครับ
พื้นฐานการบีบอัดเสียง
จากความรู้วิทยาศาสตร์น่าจะสมัยม.ต้น ที่บอกว่าคนเรายินเสียงช่วงความถี่ตั้งแต่ 20 – 20,000 Hz ครับ เจ้าเลขนี้จะบอกว่าวัตถุที่กำเนิดเสียงสั่นด้วยอัตรากี่ครั้งต่อวินาที เช่นที่ 35 Hz ลำโพงก็จะสั่น 35 ครั้งต่อวินาที เราจะได้ยินเป็นเสียงต่ำครับ ส่วนความถี่ที่สูงๆ ขึ้นอย่าง 15,000 Hz จะได้ยินเป็นเสียงสูง แต่ใช่ว่าทุกคนจะยินเสียงครบทั้งหมดแบบนี้หรอกครับ เพราะประสาทหูเราจะค่อยๆ เสื่อมลง ในวัยผู้ใหญ่จึงอาจจะรับเสียงได้แค่ช่วง 20-15,000 Hz ชัดเจนเท่านั้น ส่วนเสียงอื่นๆ ก็ยังได้ยินอยู่แต่ว่าจะได้ยินเบาลง จนบางทีก็ไม่รู้สึกว่ามีเสียงนี้อยู่
แล้วในเรื่องเสียงภาคดิจิตอลยังมีตัวเลขอีก 2 ตัวเข้ามาเกี่ยวข้องครับ นั้นคือ bit depth เช่นที่มักเห็นเป็น 16 bit กับ 24 bit และ sample rate อย่าง 44,100 Hz หรือ 48,000 Hz การจะเข้าใจเรื่องนี้เราต้องเข้าใจเรื่องดิจิตอลก่อนครับ อย่างที่รู้ๆ กันครับว่าดิจิตอลเก็บข้อมูลเป็น 0 กับ 1 แต่ถ้ามันเก็บได้แค่นี้ สงสัยเราคงได้ยินแต่เสียงอิ้ดๆ แน่ๆ การเก็บเสียงเสียงดิจิตอลจึงต้องใช้ชุดของข้อมูล ถึงจะเก็บข้อมูลเสียงได้ครบ
ดูในภาพนะครับ คลื่นเสียงที่เห็นจะมีลักษณะเส้นโค้งๆ นะครับ มีสองแกนคือแกนตั้งกับแกนนอน ซึ่ง bit depth จะเกี่ยวข้องกับแกนตั้งครับ จำนวน bit depth คือจำนวนข้อมูลที่อ้างอิงได้ในแกนตั้งครับ ถ้าเก็บ 1 bit จะอ้างอิงเสียงได้ 2 ค่า อย่าง 4 bit อ้างอิงได้ 16 ค่า แล้ว 16 bit จะอ้างอิงได้ 65,536 ค่า จะเห็นว่ายิ่งเลขมากข้อมูลที่เก็บได้ยิ่งละเอียด
ส่วนอีกค่าหนึ่งคือ sample rate ค่านี้จะแทนแกนนอน มีความหมายว่าใน 1 วินาทีจะมีการเก็บข้อมูลกี่ครั้ง อย่าง 44,100 ก็คือใน 1 วินาทีจะมีการเก็บข้อมูล 44,100 ครั้งครับ ยิ่งเลขมาก ข้อมูลที่เก็บได้ก็จะยิ่งละเอียด ค่าที่เห็นบ่อยๆ คือ 44,100 Hz เพราะเป็นความละเอียดที่ใช้บนแผ่น CD เพลง แหะๆ แอบเห็นหน้างง งั้นดูภาพครับ
แล้วทำไมยิ่ง bit-depth และ sample rate สูงแล้วยิ่งเก็บข้อมูลเสียงได้ละเอียด เราลองมาดูภาพนี้กันนะครับ
เส้นสีเทาคือสัญญาณเสียงในระบบอนาล็อก หรือเสียงจากธรรมชาติครับ การจะนำมาเก็บเป็นข้อมูลดิจิตอล เส้นสีเทาจะถูกแปลงเป็นเส้นสีแดง ซึ่งจะเห็นได้ว่ามันไม่ทับกัน แค่ใกล้เคียงกัน เพราะสัญญาณดิจิตอลจะอ้างอิงลักษณะของคลื่นเสียงจาก sample rate (แกนนอน) และ bit-depth (แกนตั้ง) เพื่อนำมาแทนเสียง เราจะเห็นความละเอียดของทั้งสองแกนจากช่องสี่เหลี่ยมปะๆ ด้านหลังเส้นครับ เพราะฉะนั้นยิ่งมี sample rate และ bit-depth ที่สูงขึ้น ช่องสี่เหลี่ยมปะๆ ที่ใช้อ้างอิงสัญญาณดิจิตอลก็จะยิ่งถี่ขึ้น ละเอียดขึ้น สัญญาณที่สร้างจากแกนอ้างอิงนี้จึงละเอียดขึ้นด้วย จนสามารถแทนเสียงธรรมชาติได้ใกล้เคียงที่สุด
สรุปนะครับ ยิ่ง bit-depth มาก และ sample rate สูง เสียงก็จะยิ่งดี แต่มีข้อควรจำอยู่ว่า ถ้าต้นฉบับมี bit-depth และ sample rate อยู่แล้ว การไปเพิ่มให้มันสูงขึ้น ไม่ได้ทำให้เสียงดีขึ้นนะครับ เพราะคุณจะเอาข้อมูลที่ไหนไปเพิ่มให้กับเสียงที่มีข้อมูลอยู่เท่านั้น แถมยังทำให้ไฟล์ใหญ่ขึ้นโดยไม่มีประโยชน์อีกตั้งหาก เช่นแผ่น CD มี bit-depth ที่ 16 bit และ sample rate ที่ 44,100 Hz การที่เราไปสั่ง rip เพลงให้เป็น mp3 ที่มี sample rate 48,000 Hz ไม่ทำให้เสียงดีขึ้นครับ
ประเภทของการบีบอัดเสียง
การบีบอัดเสียงมี 2 ประเภทครับ คือแบบ lossless กับ lossy ซึ่ง lossless คือการบีบอัดที่ไม่มีการเสียข้อมูลเสียงเลย ต้นฉบับเป็นอย่างไร ไฟล์ที่บีบอัดแล้ว เมื่อคลายออกมาจะเหมือนเดิมเป๊ะๆ แต่ข้อเสียของไฟล์ประเภทนี้คือขนาดที่ค่อนข้างใหญ่กว่าแบบ lossy พอสมควร
เราจะดูจำนวนข้อมูลที่ใช้จาก bit rate ซึ่งมีหน่วยเป็น kbps ครับ มันย่อมาจาก kilo bit per second หรือจำนวนบิตที่ใช้ใน 1 วินาที ยิ่งใช้บิตต่อวินาทีมาก จะเก็บข้อมูลได้มาก แต่ขนาดไฟล์ก็จะยิ่งใหญ่ครับ
อย่างไฟล์ FLAC กับเพลงยาว 5 นาที จะใช้พื้นที่ราวๆ 30 Mb ถ้าดูที่ bit rate ก็จะใช้ราวๆ 900 kbps (เพลงในแผ่น CD จะใช้ bit rate ที่ 1411 kbps ครับ) เทียบกับ mp3 ทั่วๆ ไปที่ใช้ 128 kbps ก็จะใหญ่กว่า 8-9 เท่าเลยทีเดียว แต่แน่นอนว่าเสียงดีกว่ากันแบบเทียบกันไม่ได้เลย รูปแบบไฟล์ที่เป็นแบบ lossless ก็เช่น FLAC, WavPack, Apple Lossless, WMA Lossless ครับ ส่วน wav ไม่ถือว่าเป็น lossless นะครับ เพราะไม่ได้บีบข้อมูลอะไร
ส่วน Lossy คือการบีบอัดที่ทิ้งข้อมูลออกไปบ้าง เช่นเสียงสูงๆ เหนือกว่า 15000 Hz ก็จะถูกตัดทิ้งออกไป ส่วนจะตัดอย่างไรบ้างขึ้นอยู่กับโมเดลเสียงที่มนุษย์รับรู้ (psychoacoustic model) ที่อยู่ในโปรแกรมเข้ารหัสเสียงครับ (Encoder) แล้วจะตัดเยอะแค่ไหนขึ้นอยู่กับ bit rate ที่ใช้ ยิ่งใช้ค่าสูง ก็จะตัดข้อมูลน้อย ไฟล์ยิ่งใหญ่ เสียงยิ่งดีครับ ที่นี้จึงเป็นปัญหาของเราว่าควรจะใช้ bit rate เท่าไหร่ดี อ่านไปเรื่อยๆ ครับผมจะอธิบายให้ฟัง ส่วนรูปแบบไฟล์ที่เป็น Lossy ก็เช่น mp3, mp2, ogg, wma, aac ครับ
ข้อควรจำนะครับ ด้วยความที่ lossy มีการตัดข้อมูลออกมาบ้างระหว่างการแปลงไฟล์ เราจึงควรหลีกเลี่ยงการนำไฟล์ lossy มาแปลงไฟล์ซ้ำๆ ครับ เช่นเอา mp3 ที่ 128 kbps มาแปลงเป็น ogg ที่ 160 kbps เสียงที่ได้ก็จะแย่กว่า mp3 ด้วยซ้ำ เพราะข้อมูลเรามีอยู่เท่านี้ แต่เราไปแปลงมันอีก ให้มันตัดทอนข้อมูลลงไปอีกครับ รวมถึงการแปลงจาก lossy ไปยัง lossless ด้วยนะครับ อย่าง mp3 -> flac ขนาดไฟล์จะใหญ่ขึ้นมาก แต่คุณภาพก็เท่ากับ mp3 นั้นแหละครับ เออ การเซฟเป็นไฟล์แบบ lossy ซ้ำๆ ก็ทำให้เสียคุณภาพได้ด้วยนะครับ อย่างเราเปิดไฟล์ mp3 ขึ้นมาตัดต่อ แล้วเซฟทับลงไปในไฟล์เดิม ยิ่งเซฟทับบ่อยครั้งเท่าไหร่ คุณภาพไฟล์ก็จะเสียไปเยอะเท่านั้นครับ
สรุปนะครับ ถ้าต้องการเสียงดีๆ หรือเก็บไฟล์ระดับที่เทียบเท่าต้นฉบับ แบบว่าถ้าแผ่นต้นฉบับพังแล้วเอาไฟล์นี้ไปไรท์ใหม่ จะได้คุณภาพเท่าเดิมเลย ให้ใช้ไฟล์แบบ lossless ครับ แต่ถ้าพื้นที่น้อย แล้วลองฟังดูแล้ว แยกความแตกต่างระหว่างเสียงจาก Lossless และ Lossy ไม่ได้ ก็บีบเป็นพวก Lossy ก็ได้ครับ
ลักษณะของการใช้ Bit-rate
จบเรื่องประเภทไปก็มาเข้าเรื่องลักษณะของการใช้ bit rate กันต่อเลยครับ คุณผู้อ่านเคยสังเกตเห็นไฟล์ mp3 ที่เวลาเราเล่นแล้วตัวเลขตรง kbps มันเปลี่ยนไปเปลี่ยนมารึปล่าวครับ ไม่ได้แสดงคงที่ที่ 128 kbps ตลอดเวลา ถ้าคุณเคยเห็นก็แปลว่ากำลังเห็นผี mp3 ตามหลอกหลอนนนคุณอยู่... แหะๆ ไม่ใช่ครับมันเป็น mp3 ที่ใช้ bit rate แบบ VBR หรือ ABR ครับ
ลักษณะของการใช้ Bit rate จะมีสามแบบคือ CBR, VBR, ABR ซึ่งแตกต่างกันดังนี้
CBR (constant bitrate) เป็นการใช้ bit rate ที่พื้นฐานที่สุด ซับซ้อนน้อยที่สุด ให้คุณภาพแย่ที่สุด แต่เราเห็นใช้กันมากที่สุด CBR คือใช้ bit rate คงที่ ไม่ว่าเสียงตอนนั้นจะซับซ้อน หรือไม่มีเสียงอะไร bit rate ก็จะยังค้างอยู่ค่านั้น ไม่ยืดหยุ่นใดๆ เช่นค้างอยู่ที่ 128 kbps ตลอดเวลา ข้อดีของมันคือ เราคำนวณขนาดไฟล์ได้ก่อนที่จะแปลงไฟล์ และเหมาะสมสำหรับทำ streaming แบบที่ห้ามใช้ bit rate เกินจากที่กำหนด
ABR (average bitrate) อยู่ตรงกลางระหว่าง CBR กับ VBR ครับ ลักษณะของ ABR คือ bit rate จะขึ้นๆ ลงๆ ได้ตามความซับซ้อนของเสียงในขณะนั้น แต่จะให้ผู้ใช้ระบุค่าได้ว่าจะให้ bit rate อยู่ราวๆ ไหน เช่นป้อนไปที่ 128 kbps ระดับของ bit rate จะขึ้นๆ ลงๆ อยู่ประมาณ 128 kbps ครับ
VBR (variable bitrate) เป็นการใช้ bit rate ที่ให้ประสิทธิภาพสูงที่สุด เป้าหมายของ VBR จะต่างจาก ABR และ CBR ครับ คือ VBR จะพยายามคงระดับคุณภาพของเสียงให้คงที่ตลอดเพลง ด้วย bit rate ที่ต่ำที่สุดเท่าที่จะเป็นไปได้คือดูจากคุณภาพเสียงเป็นหลัก เช่นช่วงที่ไม่มีเสียง มันก็ใช้ bit rate ที่ต่ำที่สุดเลยคือ 32 kbps ต่างจากอีก 2 อย่างที่เหลือที่จะพยายามคง bit rate ตามที่กำหนดเอาไว้ ส่วนคุณภาพเสียงจะแกว่งๆ ไม่เท่ากันทั้งเพลง ข้อเสียของ VBR ก็ตรงข้ามกับ CBR ครับ คือเราไม่สามารถคำนวณขนาดไฟล์ที่จะได้ เพราะ bit rate ที่ใช้มันจะเปลี่ยนไปเรื่อยๆ และเรื่อง streaming ที่เราคุม bit rate ไม่ได้ครับ
สรุปนะครับ VBR จะให้เสียงคุณภาพดีที่สุด ABR อยู่ในระดับรองลงมา แล้ว CBR อยู่ท้ายสุด เพราะฉะนั้นเวลาจะใช้ก็ใช้เป็น VBR ดีกว่าครับ
การบีบอัดเสียงประเภทต่างๆ
MP3 (MPEG Audio Layer-3)
เป็นรูปแบบไฟล์ที่พวกเรารู้จักกันดีนะครับ เพราะเกิดขึ้นมานานแล้ว (เข้าสู่มาตรฐาน ISO เมื่อปี 1991) ถือเป็นรูปแบบไฟล์แบบ lossy ตัวแรกที่ได้รับความนิยมในวงกว้าง เพราะความสามารถในการบีบอัดที่สามารถลดข้อมูลได้กว่า 10 เท่า ในคุณภาพที่ยอมรับได้ ข้อดีของ mp3 คือเป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลาย หาเครื่องเล่นง่าย ทำให้มั่นใจว่าถ้าบีบอัดเป็น mp3 แล้วจะหาเครื่องเล่นได้แน่ๆ แต่ข้อเสียคือมีประสิทธิภาพน้อยกว่ารูปแบบไฟล์ใหม่ๆ เช่น ogg หรือ aac แล้วก็ยังไม่สามารถเก็บเสียงความละเอียดสูงเกินกว่า 48,000 Hz แถมยังใช้ Bit rate สูงสุดได้แค่ 320 kbps บางทีมันก็ไม่เพียงพอสำหรับระดับหูทองคำ เก็บเสียง multichannel ไม่ได้ แล้วยังมีปัญหาเรื่องสิทธิบัตรอันแสนจะวุ่นวายด้วยครับ
เรื่อง mp3 ที่ผมจะพูดถึงวันนี้จะอ้างอิงข้อมูลจาก LAME encoder นะครับ ซึ่ง LAME นี้ถือเป็นโปรแกรมแปลงไฟล์ MP3 ที่ดีที่สุดตัวหนึ่งในปัจจุบัน พัฒนากันมาตั้งแต่ปี 1998 จนปัจจุบันอยู่ที่รุ่น 3.97 ครับ LAME ถูกนำไปใช้ในโปรแกรมมากมาย เช่น Flash รวมถึงโปรแกรมแปลงเพลงต่างๆ ที่เราใช้กันอยู่อย่าง CDex, dBPowerAmp หรือ Winamp (Mp3Dev ก็คือ LAME ครับ) ที่สำคัญมันเป็น freeware ด้วยครับ
จากที่กล่าวไปข้างต้นว่าหากเรียงลำดับคุณภาพจากมากไปน้อยแล้วจะเป็นตามนี้ VBR > ABR > CBR เพราะฉะนั้นเวลาแปลง MP3 จึงควรใช้เป็น VBR ซึ่ง LAME จะใช้ค่า VBR เป็น V (แต่บางโปรแกรมใช้ Q ครับ) ต่างๆ ตั้งแต่ V0 ซึ่งมีคุณภาพสูงที่สุดจนถึง V9 ที่คุณภาพแย่ที่สุด แต่ว่าขนาดเล็กที่สุด สรุปเป็นตารางได้ดังนี้
ระดับ | Preset | Bit rate เป้าหมาย (kbps) | ช่วงของ bit rate | จะตัดเสียงตั้งแต่ความถี่นี้ขึ้นไป | Resample |
V0 | --preset fast extreme | 240 | 220...260 | 19383 Hz - 19916 Hz | |
V1 | | 210 | 200...250 | 18671 Hz - 19205 Hz | |
V2 | --preset fast standard | 190 | 170...210 | 18671 Hz - 19205 Hz | |
V3 | | 175 | 155...195 | 17960 Hz - 18494 Hz | |
V4 | --preset fast medium | 165 | 145...185 | 17960 Hz - 18494 Hz | |
V5 | | 130 | 110...150 | 16538 Hz - 17071 Hz | |
V6 | | 115 | 95...135 | 15826 Hz - 16360 Hz | |
V7 | | 100 | 80...120 | 14581 Hz - 14968 Hz | 32000 Hz |
V8 | | 85 | 65...105 | 12516 Hz - 12903 Hz | 32000 Hz |
V9 | | 65 | 45...85 | 9774 Hz - 10065 Hz | 24000 Hz |
จากตารางจะเห็นได้ว่านอกจากที่ V สูงๆ จะใช้ bit rate ที่ต่ำมาก จึงให้ขนาดไฟล์ที่เล็กแล้ว อย่าง V9 ที่ใช้ bit rate แค่ประมาณ 65 kbps แต่ว่าเสียงช่วงตั้งแต่ 9774 Hz ขึ้นไปจะถูกตัดทิ้ง แล้วเสียงยังถูกลดความละเอียดลงเหลือแค่ 24000 Hz ด้วย จึงไม่เหมาะกับเสียงดนตรีอย่างแรง
แล้ว bit rate ไหนที่ควรใช้ เราลองมาดูกราฟนี้กันครับ
จะเห็นได้ว่าตั้งแต่ V3 ขึ้นไป ระดับคุณภาพ (Quality) เพิ่มขึ้นไม่มาก แต่ขนาดไฟล์เพิ่มขึ้นอย่างต่อเนื่อง จนถึงระดับสูงสุดคือ CBR 320 kbps คุณภาพก็ไม่แตกต่างจาก V3 มากนัก เพราะฉะนั้นระดับที่ควรใช้จึงเป็นราวๆ V3 (ประมาณ 175 kbps) หรือ V2 (ประมาณ 190 kbps) ครับ ก็จะได้เสียงที่ดีจนแยกไม่ออกจากต้นฉบับเลย ถ้าสูงกว่านี้จะเป็นระดับที่ใช้เก็บรักษาต้นฉบับแล้วครับ เช่นระดับสูงสุดของ mp3 คือ CBR 320 kbps ซึ่งถ้าต้องการนำไปใช้ในงานแบบนี้ แนะนำให้ใช้เป็นไฟล์ lossless ไปเลยดีกว่าครับ แต่ถ้าต้องการขนาดที่เล็กกว่านี้ เช่นอยากเอาไปใส่ในเครื่องเล่น mp3 ที่มีความจุไม่มาก ก็แนะนำให้ใช้ราวๆ V5 ครับ
แล้วถ้าโปรแกรมของคุณให้เลือก preset ได้ อย่าง --preset fast medium ก็ไม่ต้องสงสัยไปครับ มันก็คือ VBR ระดับ V4 ที่ใช้ VBR new ด้วยนั้นเอง ไม่แตกต่างกันกับการสั่งด้วย V4 VBR new เลย สั่งได้เหมือนกันทั้งคู่ครับ แล้วที่นี้ VBR new คืออะไร มันคือตัวเลือกหนึ่งของ LAME ครับ ถ้าโปรแกรมของคุณมีให้เลือกใช้ VBR new ก็เลือกใช้ไปเลยครับ เพราะจะทำงานได้เร็วกว่า และคุณภาพสูงกว่า
ต่อมาถ้าโปรแกรมที่คุณใช้ให้เลือกประเภทของ Stereo ได้ว่าจะเป็น Stereo, Joint Stereo, Mono ให้เลือกเป็น Joint Stereo ครับ ประสิทธิภาพจะดีที่สุด คือจะทำให้ลดข้อมูลที่ต้องเก็บได้ แต่คุณภาพยังเป็นระดับ Stereo อยู่ เพราะว่า Joint Stereo จะใช้วิธีจัดการเสียง Stereo 3 แบบผสมกัน ให้เหมาะกับเสียงต่างๆ จึงทำให้ใช้ bit rate ได้คุ้มค่าที่สุดครับ แต่ถ้าโปรแกรมของคุณเลือกไม่ได้ มันก็มักจะตั้งให้เป็น Joint Stereo ให้อยู่แล้วครับ
สรุปนะครับ ถ้าโปรแกรมให้เลือก bit rate ต่ำสุด/สูงสุดสำหรับ VBR ได้ ต่ำสุดก็เลือกเป็น 32 kbps แล้วสูงสุดเป็น 320 kbps ครับ ที่นี้ถ้าต้องการเสียงที่ดี แต่ไม่ใช้พื้นที่เยอะโอเวอร์ ให้เลือกเป็น VBR V2 (ราวๆ 190 kbps) แล้วใช้ vbr new กับ Joint Stereo ครับ ถ้าต้องการขนาดพอดีๆ แล้วเสียงยังใช้ได้อยู่ ให้เลือกเป็น VBR V5 (ราวๆ 130 kbps) ใช้ vbr new กับ Joint Stereo เช่นกันครับ
Ogg Vorbis (.ogg)
รูปแบบไฟล์ชนิดนี้เป็นรูปแบบไฟล์โปรดของผมเลยครับ เพลงในเครื่องทุกเพลงที่ผม rip เองจะเป็นไฟล์นี้ครับ ข้อดีของไฟล์นี้คือมีประสิทธิภาพสูง ให้เสียงคุณภาพดีกว่า mp3 ใน bit rate ที่เท่ากัน สามารถรองรับ Sample rate ได้สูงสุดถึง 200,000 Hz ใช้ bit-rate ได้กว้างมาก เป็น multi channel ก็ได้ แล้วก็เป็นรูปแบบไฟล์ที่ฟรีอย่างแท้จริง ไม่มีการเรียกเก็บค่าลิขสิทธิ์หรือค่าสิทธิบัตรการใช้ไฟล์ใดๆ ทั้งสิ้น แต่ข้อเสียสำคัญของมันคือไม่แพร่หลายเท่า MP3 ครับ มีเพียงเครื่องเล่น MP3 บางยี่ห้อเท่านั้นที่เล่นไฟล์ชนิดนี้ได้ อืม iPod ก็เล่นได้นะครับ แต่ต้องใช้ Firmware พิเศษอีกตัวหนึ่งที่ชื่อว่า Rockbox
Ogg Vorbis เป็นชื่อรวมกันระหว่าง Ogg ซึ่งเป็น Container และ Vorbis ที่เป็นชื่อของตัวรหัสเสียง ถ้าเราเรียกเฉพาะเทคโนโลยีที่ใช้บีบอัดเสียงอย่างเดียวจะเรียกว่า Vorbis ครับ
ด้วยความที่ Ogg Vorbis เป็นไฟล์ที่ไม่มีค่าใช้สิทธิ์ จึงถูกนำไปใช้ในงานหลายๆ แบบ เช่นเอาไปใช้ในเกม อย่าง Doom3, GTA:SA, เกมตระกูล Unreal เป็นต้น เรียกได้ว่าแม้คนทั่วไปจะใช้ Vorbis ไม่เยอะเท่า mp3 แต่ Vorbis ก็เป็นรูปแบบไฟล์ที่สำคัญตัวหนึ่งบนโลกคอมพิวเตอร์ครับ
Ogg Vorbis รุ่นแรกออกมาในเดือนกรกฎาคม ปี 2002 โดย Xiph.Org Foundation ครับ หลังจากนั้นก็ได้พัฒนาเรื่อยมาจนมาถึงรุ่น 1.2.0 แต่รุ่นที่ผมจะแนะนำให้ใช้ไม่ใช่รุ่นนี้หรอกครับ เพราะ Xiph.Org ไม่ได้พัฒนาเพิ่มเติมในส่วนของประสิทธิภาพมานานแล้ว ความสามารถของรุ่นนี้จึงสู้รุ่น aoTuV (Aoyumi's Tuned Vorbis) ที่พัฒนาโดยชาวญี่ปุ่นชื่อ Aoyumi ไม่ได้ครับ ปัจจุบัน aoTuV อยู่ที่รุ่น Beta 5.5 ครับ ข้อมูลคราวนี้ของผมจึงอ้างอิงจาก aoTuV Beta 5 เป็นหลักครับ
จากที่ผมเคยพูดถึงเรื่อง CBR, VBR ไปแล้วนะครับ Vorbis ก็รู้เรื่องนี้ดี มันจึงไม่มีการบีบอัดแบบ CBR ให้เลือก มีแค่ ABR และ VBR ครับ ซึ่ง VBR ของ vorbis จะใช้ q แทนระดับคุณภาพของเสียงดังนี้ครับ
ตัวเลือก | Bit rate เป้าหมาย โดยประมาณ (kbps) | ช่วงของ bit rate (kbps) |
-q -2 | ~32 | ~32 – ~64 |
-q -1 | ~48 | ~48 – ~64 |
-q 0 | ~64 | ~64–~80 |
-q 1 | ~80 | ~80 – ~96 |
-q 2 | ~96 | ~96 – ~112 |
-q 3 | ~112 | ~112 – ~128 |
-q 4 | ~128 | ~128 – ~160 |
-q 5 | ~160 | ~160 – ~192 |
-q 6 | ~192 | ~192 – ~224 |
-q 7 | ~224 | ~224 – ~256 |
-q 8 | ~256 | ~256 – ~320 |
-q 9 | ~320 | ~320 – ~500 |
-q 10 | ~500 | ~500 – ~1000 |
แล้วค่าไหนที่ควรใช้บ้าง ค่าที่เหล่าผู้เชี่ยวชาญเรื่องเสียงจากเว็บ Hydrogen Audio แนะนำมีสองค่าครับ ถ้าต้องการไฟล์ขนาดเล็ก สำหรับเครื่องที่พื้นที่น้อยๆ หรือใส่ในเครื่องเล่นเพลง ที่ระดับ q 2 ก็เพียงพอสำหรับคนทั่วไปที่ไม่ต้องการความละเอียดเรื่องเสียงมากแล้วครับ ผมลองดูแล้วระดับนี้จะให้เสียงดีกว่า mp3 ที่ 128 kbps นิดหน่อยครับ แต่ถ้าต้องการไฟล์ที่มีคุณภาพใกล้เคียงกับ CD มากแบบแยกกันไม่ออก ก็แนะนำที่ระดับ q 5 ครับ ถ้าใครยังไม่สะใจก็เพิ่มขึ้นได้อีก แต่ q 5 คือขั้นต่ำที่สุดที่ยอมรับกันว่าเสียงใกล้เคียงกับ CD มากแล้วครับ แต่ก็ต้อง rip จาก CD จริงๆ นะครับ ไม่ใช่ไปแปลงไฟล์แบบ lossy ตัวอื่นมา
สรุปนะครับถ้าต้องการใช้ OGG ก็ให้ใช้รุ่น aoTuV beta5.5 ไปเลยครับ ผมทดลองรุ่นนี้มาพอสมควรแล้ว ทั้งเล่นบนคอมพิวเตอร์ และเครื่องเล่น mp3 ก็ไม่มีปัญหาใดๆ ส่วนการเลือกคุณภาพ ใช้ q 2 สำหรับงานที่ต้องการขนาดไฟล์เล็กๆ ครับ และ q 5 สำหรับงานที่ต้องการคุณภาพเทียบเท่า CD
AAC (Advanced Audio Coding) (.m4a , .aac , .mp4)
มาถึงเทคโนโลยีการบีบอัดไฟล์แบบที่ 3 กันแล้วนะครับ กับ AAC ผู้ร่วมพัฒนาเทคโนโลยีนี้คือผู้พัฒนา mp3 นั่นเอง ทำให้รูปแบบนี้มีความสามารถเหนือกว่า mp3 ครับ ปัจจุบันยังไม่แพร่หลายในวงกว้างเท่าไหร่ แต่รูปแบบนี้เป็นไฟล์มาตรฐานบน iTunes Store และ iTunes ก็แนะนำให้ใช้ AAC เวลา rip เพลง เทคโนโลยีนี้จึงใช้มากบน iPod ครับ ซึ่งมีผู้ใช้มากขึ้นเรื่อยๆ จนทำให้หลายค่ายเริ่มออกมารองรับไฟล์ชนิดนี้ อย่าง Sony เป็นต้น
ข้อดีของ AAC ที่เหนือกว่า mp3 ก็คือ รองรับ sample rate มากขึ้นเป็น 8,000 – 96,000 Hz แล้วยังรองรับได้ถึง 48 ช่องสัญญาณ ทำให้ทำ multichannel ได้ แล้วยังให้คุณภาพเสียงที่สูงกว่า mp3 ด้วยเทคนิคการบีบอัดแบบใหม่ๆ ครับ แต่ข้อเสียของมันอยู่ที่การที่มันมีรูปแบบภายในเยอะ เช่น LC, HE, SSR, LTP ฯลฯ ทำให้มีปัญหากับเครื่องเล่น บางเครื่องอาจจะเล่น HE-AAC ไม่ได้ แต่เล่น LC-AAC ได้ ซึ่งก็ต้องอ่านคู่มือดูนะครับ ว่าเครื่องคุณเล่นไฟล์อะไรได้บ้าง แล้วยังมีปัญหาเรื่องสิทธิบัตรยุ่งวุ่นวาย เพราะหลายบริษัท พัฒนาหลายเทคโนโลยี แล้วก็ถือสิทธิบัตรในเทคโนโลยีต่างๆ
AAC มี 2 แบบใหญ่ๆ ครับ คือ LC (Low Complexity) และ HE (High Efficiency) ความแตกต่างระหว่าง 2 ตัวอยู่ที่ LC จะมีความซับซ้อนน้อยกว่า จึงเหมาะกับไฟล์ที่ใช้ bit rate มากกว่า 80 kbps ครับ เพราะมี bit rate เยอะพอที่จะเก็บข้อมูลได้ดีพอ ไม่ต้องใช้กระบวนการพิเศษกับข้อมูล ทำให้ LC-AAC สามารถใช้กับเครื่องเล่นที่เล่น AAC ส่วนใหญ่ได้
แต่ HE นั้นจะใช้วิธีบีบอัดไฟล์แบบพิเศษ คือ Spectral band replication (SBR) ในการจัดการกับเสียงความถี่สูง แบบเดียวกับที่ใช้ใน mp3pro และ Parametric Stereo เพื่อจัดการเสียง stereo (จะมีใน HE-AAC รุ่นที่ 2 ครับ) แต่ 2 วิธีพิเศษนี้จะไม่เหมาะเมื่อใช้ bit rate สูงๆ เพราะว่าทั้งสองวิธีเป็นการโยนข้อมูลต้นฉบับทิ้งไปครับ แล้วใช้ความสามารถของคณิตศาสตร์ในการคำนวณข้อมูลที่สูญหายกลับขึ้นมา เพื่อให้ใช้ bit rate ต่ำลง แม้ว่ามันจะให้คุณภาพที่ดี แต่ยังสู้ของแท้ๆ จากต้นฉบับไม่ได้ เพราะฉะนั้นเมื่อมี bit rate มากพอ จึงไม่แนะนำให้ใช้ HE ครับ นอกจากนี้ยังมีเครื่องเล่นบางรุ่นเท่านั้นที่รองรับ HE-AAC การใช้งานจึงไม่กว้างเท่า LC-AAC รูปแบบของ HE จึงเหมาะกับไฟล์ที่ต้องใช้ bit-rate น้อยกว่า 80 kbps ครับ ซึ่งถ้าใช้ Nero AAC Encoder มันจะเลือกใช้ให้เราโดยอัตโนมัติ แต่ถ้าใช้ iTunes จะสร้างไฟล์แบบ HE ไม่ได้ แถม iPod ก็ยังเล่น HE-AAC ไม่ได้ครับ ช่างน่าเสียดายจริงๆ
ส่วนสารพัดเครื่องหมายการค้าของไฟล์ AAC นั้น เครื่องหมายที่หมายถึง HE-AAC มีดังนี้ครับ
aacPlus และ aacPlus v2 (HE-AAC รุ่นที่ 2) ของ Coding Technologies
Nero Digital ของ Nero
AAC+ ของ Nokia, Samsung และ Motorola แต่ถ้าเขียนว่า eAAC+ จะหมายถึง HE-AAC รุ่นที่ 2 ส่วน Motorola จะใช้ AAC+ Enhanced แทน HE-AAC รุ่นที่ 2 ครับ
นอกจากจะมีลักษณะภายในของไฟล์มากมาย และชื่อทางการค้ามากมายแล้ว AAC ยังใช้นามสกุลของไฟล์มากมาย เช่น
.mp4 ใช้ container ของ mp4 ซึ่งอาจจะเก็บทั้งภาพและเสียง หรือเสียงอย่างเดียวก็ได้ แต่ไฟล์ .mp4 ก็ไม่ใช่ AAC เสมอไป
. m4a ใช้ container ของ mp4 แต่เก็บเฉพาะเสียง
.m4p อันนี้เป็นไฟล์แบบ Protect ไว้ครับ
.m4b ไฟล์สำหรับ audiobook
.aac ไฟล์ที่ใช้โครงสร้างของ AAC เพียวๆ ไม่ได้ถูกห่อด้วย container ของ mp4
แต่ iPod จะไม่รองรับไฟล์นามสกุล .aac นะครับ เขียนมาถึงตรงนี้ผมก็ปวดหัวกับเจ้า AAC นี้ไม่น้อยเลย จนทำให้รู้สึกว่าโลกของธุรกิจจะทำให้ชีวิตพวกเรายุ่งยากขึ้น สร้างสารพัดเทคโนโลยีขึ้นมา แล้วดันไม่รองรับให้ทั้งหมด
แบบว่าเหนื่อยแล้ว ผมสรุปส่วนของการใช้งานเลยแล้วกันครับ ถ้าต้องการใช้ไฟล์ AAC นั้น ผมแนะนำ Encoder 2 ตัวคือ iTunes หรือไม่ก็ Nero AAC ครับ ทั้งสองตัวนี้ก็ใช้ฟรีทั้งคู่ ถ้าใครใช้ iPod ก็ใช้ iTunes ไปเถอะครับ จะได้ไม่มีปัญหาอะไร แต่ถ้าใครไม่อยากใช้ iTunes หรือใช้อุปกรณ์ค่ายอื่นก็ลองอ่านดูดีๆ ครับว่าอุปกรณ์ของท่านรองรับ AAC แบบไหนบ้าง ถ้ารองรับได้ถึง HE-AAC v2 ก็แนะนำ Nero AAC เต็มอัตราเลยครับ แต่ถ้ารองรับไม่ถึง ก็สามารถสั่ง nero ได้ ว่าเอาแค่มาตรฐานนี้ หรือไม่ก็ rip ให้มากกว่า 80 kbps ครับ จะได้ไฟล์ LC-AAC มาโดยอัตโนมัติ สำหรับค่าที่ควรใช้เวลา rip เพลงนะครับ ถ้าต้องการไฟล์เล็กๆ ก็ใช้ที่ประมาณ 128 kbps ถ้าต้องการคุณภาพสูงหน่อย ก็ใช้ประมาณ 160 kbps ครับ ถ้าเครื่องรองรับ HE-AAC ก็สามารถใช้ bit rate ที่ต่ำกว่านี้ได้ อย่าง 50-70 kbps ครับ
WMA (Windows Media Audio) (.wma)
มาถึงไฟล์ชนิดสุดท้ายในรูปแบบของ Lossy ที่ผมจะเขียนถึงซะทีนะครับ กว่าผมจะเขียนมาถึงตรงนี้ก็ใช้เวลาหลายวันอยู่ แล้วก็คงใช้เวลาอีกหลายวันกว่าบทความจะเสร็จ เอาน่า สู้ตายเก็บเงินซื้อลำโพง
หลายคนอาจจะคิดว่า WMA ก็น่าจะมีอย่างเดียวนิน่า เพราะเราก็เห็น WMA มาตั้งแต่ไหนแต่ไรแล้ว แต่จริงๆ แล้ว WMA แยกย่อยเป็น 4 เทคโนโลยีดังนี้ครับ
Windows Media Audio (WMA)
เป็นรูปแบบไฟล์ WMA ดั้งเดิมที่พวกเรารู้จักกันครับ สามารถเล่นกับเครื่องเล่นที่รองรับ WMA ได้มากที่สุด แต่ประสิทธิภาพนั้นเท่าๆ กับ mp3 แต่ mp3 (โดยเฉพาะ LAME รุ่นล่าสุด) จะทำได้ดีกว่าใน bit rate ที่มากกว่า 128 kbps รุ่นล่าสุดคือ 9.2 ที่มากับ Windows media player 11
WMA รองรับ sample rate สูงสุดที่ 48,000 Hz ครับ แล้วเพิ่งใช้ VBR ได้ในรุ่น 9 นี้เอง ผมจึงไม่แนะนำให้ใช้ WMA แบบนี้ เพราะประสิทธิภาพไม่ดีเท่าไหร่ แถมการใช้งานยังไม่กว้างเท่า mp3 ด้วยครับ
Windows Media Audio Professional (WMA pro)
เป็นรูปแบบที่พัฒนาขึ้นมาใหม่ครับ ไม่รองรับกับมาตรฐาน WMA เดิม เริ่มมีพร้อมกับ Windows media player 9 ปัจจุบันเป็นรุ่น WMA 10 pro ข้อดีของรูปแบบนี้ให้ประสิทธิภาพที่ดีกว่า WMA มาก ในทุกด้าน ทั้งที่ bit rate สูงและต่ำ แล้วยังรองรับ sample rate ได้ถึง 96,000 Hz ที่ 24 bit แล้วยังทำได้ถึง 8 ช่องสัญญาณ (7.1 channel) ความสามารถของ WMA pro จึงสามารถเทียบชั้นกับ Vorbis, AAC ได้ และเหนือกว่า mp3 ครับ
แต่ข้อเสียของ WMA pro นี้คือการที่ไม่รองรับกับมาตรฐาน WMA เดิม ทำให้อุปกรณ์ที่เคยเล่น WMA เดิมได้ไม่สามารถเล่น WMA pro นี้ได้ จึงมีอุปกรณ์ไม่กี่ชนิดที่รองรับ เช่นโทรศัพท์มือถือที่ใช้ Windows mobile ที่มี windows media player 10 เป็นต้น
Windows Media Audio Lossless (WMA lossless)
รูปแบบนี้ก็เพิ่งมาใหม่ใน Windows media player 9 ครับ เป็นรูปแบบไฟล์ที่จัดเก็บแบบไม่มีการสูญเสียข้อมูลใดๆ ครับ ความสามารถก็จัดอยู่ในระดับที่ดี แต่ก็ยังมีอุปกรณ์ที่รองรับน้อยอยู่ อุปกรณ์ที่รองรับก็เช่นโทรศัพท์มือถือที่ใช้ Windows mobile ที่มี Windows media player 10 หรือ Zune 2 ครับ
Windows Media Audio Voice (WMA voice)
เป็นรูปแบบที่ออกแบบมาเพื่อจัดเก็บเสียงพูดโดยเฉพาะครับ ใช้ bit rate ต่ำมาก แต่คุณภาพเสียงพูดยังใช้ได้อยู่ ทำงานโดยการตัดความถี่ที่ไม่เกี่ยวกับเสียงพูดทิ้งทั้งหมด ทำให้มีพื้นที่เก็บข้อมูลในส่วนของเสียงพูดมาก รูปแบบนี้รองรับ sample rate แค่ 22,050 Hz เป็นเสียง mono อย่างเดียว แล้วก็ใช้ bit rate สูงสุดแค่ 20 kbps ครับ ไม่แนะนำให้ใช้กับงานอย่างอื่นนอกจะเสียงพูดครับ อุปกรณ์ที่รองรับก็ยังเป็นโทรศัพท์มือถือที่ใช้ Windows mobile เหมือนเดิมครับ คู่แข่งของ WMA voice ก็คือ speex รูปแบบบีบอัดเสียงพูดฟรีๆ จาก xiph.org ครับ
ซึ่งทั้งหมดนี้สามารถสร้างได้จาก Windows media player รุ่น 10 ขึ้นไปครับ
สรุปเจ้า WMA นะครับ ผมไม่แนะนำให้ใช้ WMA ครับ ใช้ mp3 ดีกว่า ยกเว้นว่าถ้าเครื่องของคุณรองรับ WMA pro ก็ใช้เป็น WMA pro ก็ได้ครับ ใช้ที่ bit rate ราวๆ 128 kbps หรือ 160 kbps ก็ให้เสียงโอเคแล้วครับ
เปรียบเทียบประสิทธิภาพของ lossy codec
มาถึงตรงนี้ผมได้แนะนำรูปแบบการบีบอัดเสียงแบบ lossy ไป 4 รูปแบบสำคัญๆ แล้วนะครับ เพื่อให้การตัดสินใจง่ายขึ้น ผมจะนำเอาผลการทดสอบจากเว็บต่างๆ มาให้ดูกันนะครับ เออ เวลาอ่านกราฟให้ดูสเกลด้วยนะครับ อย่าให้ระยะห่างของจุดมันหลอก เพราะบางที่กราฟจะถูกขยายให้เห็นชัดครับ แต่จริงๆ แล้วมันไม่ได้แตกต่างกันขนาดนั้น
ภาพแรกนี้เป็นการทดสอบคุณภาพเสียงที่ bit rate 48 kbps เมื่อเดือนพฤศจิกายน 2006 ครับ จะเห็นได้ว่า HE-AAC อยู่อันดับที่ 1 แล้ว aoTuV beta 5 กับ WMA pro 10 ตามมา ส่วน WMA 9.2 นั้นอยู่รั้งท้ายอย่างเทียบไม่ติดครับ แต่ bit rate แค่นี้ผมก็ไม่แนะนำให้ใช้ทั่วๆ ไปนะครับ ยกเว้นถ้ามีพื้นที่น้อยจริงๆ อ่านข้อมูลการทดสอบเต็มๆ กดที่รูปครับ
ต่อมาเป็นการทดสอบคุณภาพเสียงที่ bit rate 64 kbps เมื่อเดือนกรกฎาคม 2007 ครับ จะเห็นได้ว่า rating จะสูงกว่าเมื่อ 48 kbps นิดหน่อยนะครับ
การทดสอบที่ bit rate 96 kbps เมื่อเดือนสิงหาคมปี 2005 WMA ได้อันดับสุดท้ายเลย
ที่นี้ดูที่ 128 kbps ทดสอบเมื่อเดือนธันวาคม 2005 บ้างครับ จะเห็นว่าถ้าเอา mp3 (โดย LAME) ไปเทียบกับรูปแบบใหม่ๆ ประสิทธิภาพจะด้อยกว่าครับ แต่ไม่มากเท่าไหร่
ผมคงแนะนำเป็นตัวอย่างเท่านี้นะครับ ถ้าสนใจอ่านเพิ่มเติมก็ลองอ่านดูที่ http://www.soundexpert.info/index.htm และ http://en.wikipedia.org/wiki/Codec_listening_test ครับ แต่เวลาอ่านการทดสอบก็ต้องดูรุ่นของ Encoder ที่เข้าร่วมการทดสอบ รวมถึงวันที่ทดสอบด้วยนะครับ ว่าใกล้เคียงกับที่เรากำลังใช้อยู่รึปล่าว
สรุปส่วนของ Lossy
ถ้าใช้บนคอมพิวเตอร์อย่างเดียว แนะนำให้ rip เป็น Vorbis aoTuV beta 5.5 หรือ LC-AAC หรือ WMA pro แล้วแต่สะดวกครับ (แต่ผมชอบ Vorbis มากที่สุดนะครับ) เลือกให้เป็นแบบ VBR ส่วน bit rate ก็ใช้ตามที่แนะนำไปในแต่ล่ะรูปแบบไฟล์ครับ
ถ้าใช้บนเครื่องเล่นแบบพกพาด้วย ก็เลือกรูปแบบที่ดีกว่า mp3 เครื่องเล่นนั้นเล่นได้ เช่นถ้าเครื่องเล่น vorbis และ mp3 ได้ ก็แนะนำให้ใช้ vorbis ก่อนครับ หรืออย่าง iPod ก็แนะนำให้ rip เป็น AAC จะดีกว่า แต่ถ้าเครื่องนั้นเล่นได้เฉพาะ mp3 และ wma ธรรมดา (ไม่ใช่รุ่น pro) ก็แนะนำให้ rip เป็น mp3 จะดีกว่าเป็น wma ครับ ส่วน bit rate ก็ตามที่แนะนำในรูปแบบไฟล์ต่างๆ ครับ
แต่ถ้าต้องการไฟล์ที่แน่ใจว่าเล่นได้กับทุกเครื่อง ก็ต้องเป็น mp3 ครับ ปรับตามที่แนะนำนะครับ จะได้ mp3 ที่ดีที่สุด
แล้วถ้าอยากได้เสียงที่เฉียบขาด สมบูรณ์ที่สุด ก็ต้องนี้เลยครับ ไฟล์รูปแบบ Lossless ซึ่งผมจะแนะนำในบทความต่อไปครับ เพราะ Blogger มันไม่รับซะแล้ว
อย่าลืม comment นะครับ ไม่งั้นงอนไม่เอาบทความมาลงอีกจริงๆ ด้วย
ป้ายกำกับ: codec
16 ความคิดเห็น:
ขอบคุณสำหรับข้อมูลความรู้ดีๆครับ
และขอถามเพิ่มเติมครับ
WMA Pro
กับ
WMA VBR
ไฟล์ไหนมีคุณภาพมากกว่ากันครับ
อืม ถ้าตั้งเป็น VBR เหมือนกัน ที่ bit-rate เท่ากัน WMA pro เหนือกว่าแน่ๆ ครับ
แล้วแม้จะ WMA pro จะใช้เป็น CBR แต่ถ้าเทียบกับ WMA VBR ที่ bit-rate ใกล้เคียงกัน WMA pro ก็ยังเหนือกว่าอยู่ดีครับ
แล้วถ้า VBR Bit rate ที่ 300-344
และ WMA Pro Bit Rate ที่ 192
อันไหนจะแจ่มกว่ากันครับ
แบบนี้อาจจะแยกไม่ออกแล้วครับ อาจะต้องวัดด้วย spectum แต่ที่แน่ๆ คือ WMA VBR ขนาดไฟล์ใหญ่กว่ามาก
ปล. กรณีนี้ใช้เป็น mp3 ไปเลยดีกว่า
จากข้างบน ที่เกียวกับ AAC
ทำไม iPod ผมเล่้น AAC-HE ได้ล่ะ
ปกติ rip กับ Winamp ก็เลือก
mode: MP4-aacPlus (HE-AAC) High Bitrate Encoder v1.27
bitrate: 256
channel mode: stereo
มันจะออกมาได้ .m4a มันก็เล่นบน Ipod ได้นิครับ
หน้าจะมีเรื่อง Replay Gain ด้วยน่ะครับ
ผมไม่แน่ใจนักเรื่อง ipod นะครับ เพราะไม่มีไว้ใช้ส่วนตัว ใน firmware รุ่นใหม่ๆ อาจจะปรับปรุงให้ใช้ HE-AAC ได้แล้วก็ได้นะครับ หรืออาจจะเกี่ยวกับ header ของ m4a
ส่วนเรื่อง replayGain เขียนไว้อย่างละเอียดในบทความ foobar2000 ที่รอลงนิตยสาร PCtoday ครับ
ผิดพลาดอย่างสำคัญเลย เกี่ยวกับคุณภาพเสียงของ CBR กับ VBR
คุณลอง rip ซีดีเพลงดูทั้ง 2 แบบ แล้วลองใช้ Nero Wave Editor แสดงกราฟเสียงดูครับ แล้วจะรู้
VBR ดีกว่า CBR อยู่เรื่องเดียวเท่านั้นคือใช้พื้นที่น้อยกว่า (ไฟล์เล็กกว่า)
ขอบคุณสำหรับข้อมูลดีๆที่เอามาฝากครับ
ถ้าเราใช้ตัว Decoder ต่างกัน
เสียงที่ออกมามันจะต่างกันใช่มั้ยครับ
ปกติผมใช้ LibMad เป็นตัว Decoder
ให้กับไฟล์ mp3 น่ะครับ รู้สึกว่ามัน
ให้เสียงความถี่สูงออกมาได้พอดีกับย่านเสียงความถี่ต่ำเลยครับ
ต่างจากตัวDecoderตัวอื่นที่แทบไม่ได้ยินเสียงย่านความถี่สูงเลยอ่ะครับ
สุดยอดครับ ปวดหัวกับไฟล์ต่างๆจริงๆ หาบทความอย่างนี้มานานแล้วครับ
ขอบคุณสำหรับข้อมูลครับ
อ่านแล้ว ได้ความรู้เพิ่ม
สวัสดีครับท่านกูรู ทั้งหลาย พอดีผมมีงานที่อาจารย์สั่งมา ผม งง มากมายอยากได้คำอธิบายจากผู้รู้ครับผม
คำถามบอกว่า จงอธิบายพร้อมแสดงภาพประกอบ
1.track คืออะไร
2.mono track
3.stereo track
4.stereo4 track
5.multi-tracks เช่น 16tracks 32tracks 64tracks เป็นต้น
ขอบคุณมากนะครับท่านกูรู ที่ให้คำแนะนำ และความหมายนะครับ
ผมใช้ nero เป็นตัวบันทึกเสียง และใช้ adobe audition เป็นตัวตัดต่อ แต่งเสียง พอ export ออกมาเป็น mp3 ส่งสถานีวิทยุ ปรากฏว่าทางสถานีเล่นไฟล์ไม่ได้ มีปัญหาเล่นไปได้หน่อยก็วกกลับมาที่เดิม ....ปัญหาคืออะไรครับ?
ขอบคุณมากๆครับ สำหรับความรู้ดีๆ มันมีประโยชน์มากจริงๆครับ
ขอบคุณค่ะ ได้ความรู้มาอีกนิดแล้ว
ขอบคุณมากๆสำหรับความรู้ดีๆครับผม...
แสดงความคิดเห็น
สมัครสมาชิก ส่งความคิดเห็น [Atom]
<< หน้าแรก