האם אי פעם חשבת על כמה זמן אתה מבזבז כל יום על הקלטה, עריכה והעלאת תוכן לערוץ יוטיוב ללא פנים? אני בילתי עשור בצוותי שיווק של מותגים גדולים כמו אפל, פלייסטיישן וניסאן, וכיום אני מנהל סוכנות בינה מלאכותית המשרתת לקוחות במיליארדי דולרים. אתה יכול לכתוב תסריטים ידנית, לשכור שחקנים קוליים ולערוך צילומים, אבל זה איטי ויקר. הסוד האמיתי הוא מערכת שמושכת חדשות ממקורות מרובים והופכת אותן לסרטונים ללא מאמץ מצדך. אני הולך להראות לך את האוטומציה המדויקת שסורקת מקורות חדשות מרובים, כותבת תסריטים עם בינה מלאכותית, יוצרת תמונות וסרטונים שנוצרו על ידי בינה מלאכותית, כל זאת בזמן שאתה ישן. אתה תפרסם מדי יום מבלי לגעת במצלמה. ללא עריכה, ללא בזבוז זמן, רק העלאות עקביות שבונות את הערוץ שלך באופן אוטומטי. הישאר איתי כי בסוף, אראה לך כיצד לחבר את זה כדי שתוכל לפרסם לכל ערוצי המדיה החברתית לחלוטין על אוטומט. אם אתה רוצה לקבל גישה לתהליך העבודה שבנינו היום, פשוט בדוק את הקישור בתיאור כדי להצטרף למאות אחרים שלומדים לבנות ולמכור אוטומציות AI בדיוק כמוך.
תוכן עניינים
מקרה הבוחן של דילן פייג'
דילן פייג' צבר 18 מיליון עוקבים רק על ידי דיבור על אירועים שוטפים וחדשות מתפרצות. הוא מקבל מיליונים או עשרות מיליוני צפיות על כמעט כל אחד מהסרטונים שלו. אז, רציתי לראות אם נוכל לבנות אוטומציה של בינה מלאכותית כדי בעצם לשכפל סרטוני חדשות באופן אוטומטי לחלוטין.
מערכת האוטומציה של בינה מלאכותית
זו המערכת שבנינו. זה מה שהיא מייצרת. הנה דוגמה לסרטון שהמערכת יצרה באופן אוטומטי, עם קול סקסי במיוחד:
"חכה רגע. הכותרות האלה פרועות ואתה חייב לשמוע את זה. בוא נתחיל. Sunno נתבעת על נתוני אימון AI, אבל קרנות הון סיכון עדיין שופכות כסף. זה אומר הכל על…"
הסרטון ממשיך עוד כדקה. אתה יכול ליצור תסריט ארוך ככל שתרצה. בוא אסביר לך את המערכת צעד אחר צעד.
הגדרת המערכת
אנחנו משתמשים בשילוב של דברים:
- Air Table כבסיס נתונים להגדרת הפרסונה של המשתמש עם תמונה והקול שאנחנו רוצים להשתמש בו.
- הזנות RSS כדי לסרוק את החדשות והאירועים האחרונים.
- בינה מלאכותית כדי לכתוב תסריט עבורנו, כמו GPT-4.
- יצירת תמונה של מגיש החדשות והקראה קולית באמצעות 11 Labs.
- תפירת הכל יחד באמצעות שירות בשם Infinite Talk, שלוקח את האודיו שנוצר, התמונה והתסריט ומאחד אותם לסרטון אחד.
בסוף, אנחנו פשוט שומרים את הסרטון בתוך Google Drive. וכבונוס, אראה לך גם איך להגדיר את זה כך שהוא יפרסם אוטומטית כל סרטון שאתה יוצר.
הגדרת בסיס הנתונים
כל מה שאנחנו עושים בתוך Air Table זה להגדיר את המצב הרוח, כמו איך אנחנו רוצים לדבר, את המגדר, להעלות תמונה שלנו, ולבחור את הקול מ-11 Labs. יש להם מאות קולות לבחירה. אתה יכול גם לשכפל את הקול שלך עצמך, מה שממש מגניב.
ברגע שיש לך את מזהה הקול, אתה פשוט מעתיק אותו לתוך בסיס הנתונים ב-Air Table. זה כל מה שצריך לעשות, פעם אחת בלבד.
הגדרת הזנות RSS
אנחנו משתמשים בסדרה של הזנות RSS כדי למשוך מאגר של כל הכותרות המובילות מהיום. אתה יכול ליצור את ההזנה שלך על ידי הדבקת כתובת האתר או להשתמש בהזנות מוכנות מראש כמו Google News.
כל מה שעליך לעשות הוא להעתיק את כתובת ה-URL של ההזנה שאתה רוצה לקבל ממנה מידע. אנחנו משתמשים ב-Reuters, TechCrunch, CNN ו-TMZ כדי לקבל את כל הסיפורים העדכניים ביותר.
יצירת הסרטון
ברגע שיש לנו את כל המקורות האלה, כל מה שאנחנו צריכים לעשות זה לכתוב תסריט. זה ממש תלוי בך. אתה יכול להתאים אישית את זה איך שאתה רוצה. הכל מבוסס על הנחיות.
אמרתי "אתה מגיש חדשות בסגנון UGC. המשימה שלך היא לקחת את הכותרות המושכות ביותר ולהפוך אותן לתסריט לסרטון בן 60 שניות. התחל עם וו חזק, מסור את החדשות העיקריות בטון שיחה. תן משפט או שניים של פירוט ומשפט המתאר את ההשפעה שלזה תהיה על הקהל שלי."
יש לנו עוד כמה פרטים על איך אנחנו רוצים לכתוב את התסריט, טון הדיבור, הנחיות לתגי אודיו כדי לכוון את 11 Labs כשהיא יוצרת את הקריינות, כמו האם אנחנו רוצים שזה יהיה רגשי, ללחוש שורות, לצחוק, וכו'.
אנחנו גם יוצרים הנחיית תמונה כדי לתאר את המגיש או במקרה שלנו אותי ואת הסביבה שהם נמצאים בה. אולפן יוטיוב ביתי שזו התמונה שראית.
עכשיו אנחנו יכולים לנתב את זה לשני כיוונים נפרדים. הנתיב העליון פשוט מייצר את התמונה עבורנו כדי לוודא שיש לנו את התמונה המתאימה. והנתיב התחתון הזה מייצר את הקריינות בפועל.
יצירת התמונה
אנחנו משתמשים בשירות שנקרא Kai AI. זהו מקום נהדר לכל המודלים העדכניים ביותר של תמונות ווידאו של בינה מלאכותית. אנחנו בעצם מחקים את הממשק הזה באמצעות בקשת ה-API שלנו.
אנחנו נותנים לו הנחיה, פורמט פלט וגודל תמונה. במקרה שלנו, זה יהיה 916 אנכי. זה נהדר למדיה חברתית. אנחנו קוראים ל-Kai כאן ואז פשוט מעבירים את המידע הזה הלאה.
יצירת הקריינות
בנתיב התחתון, אנחנו משתמשים בשירות מעט שונה. הוא פועל בצורה דומה מאוד. במקום Kai AI, אנחנו משתמשים באתר שנקרא Wavespeed.
11 Labs נהדר דרכו. ואז יש את המודל הזה כאן, Infinite Talk, שהוא ממש מגניב. אתה יכול לראות כאן שאנחנו יכולים לקחת קליפ אודיו, תמונה ותסריט או תסריט מלא ופשוט לכלול את כל זה יחד.
זה בעצם מתאים את הקול, זה יסנכרן את השפתיים של התמונה שלנו עם רצועת האודיו בפועל. זה כל כך עוצמתי. זה לא זול במיוחד, אני אגיד. הסרטון שהראיתי כאן הוא כמו דקה ו-20 שניות. ואני חושב שזה עלה לי, אתה יכול לראות כאן, זה עלה לי 2.40 דולר.
אז, זה ממש תלוי בך אם סוג השירות הזה יהיה שווה את זה עבורך. 2.40 דולר עשוי להיראות הרבה עבור סרטון בן 2 דקות או סרטון בן דקה, אבל שוב, אם אתה צובר מיליוני צפיות לאורך זמן, אולי זה מתברר ששווה את זה בשבילך.
כאן למטה, אנחנו פשוט מייצרים את הקריינות. אנחנו קוראים ל-11 Labs דרך ה-API של Wave Speed. אנחנו מגדירים כמה פרמטרים כמו יציבות ודמיון והטקסט. אז בעצם החלק הזה הוא הכי חשוב שבו אנחנו פשוט מזרימים את התסריט שלנו ממחבר התסריטים של הבינה המלאכותית לכאן.
אנחנו מביאים את מזהה הקול שמגיע מבסיס הנתונים ב-Air Table שלנו. שוב, זה מזהה הקול עבור 11 Labs. כך שהוא יודע בדיוק איך אנחנו נשמעים, מה שמאוד מגניב.
אותו הדבר. אנחנו בודק