提交需求
賽事與廣告咨詢合作,請填寫需求表單,我們會在第一時間與您聯系!
即時生來沒有羽翼也不能阻止你展翅高飛
前些天看到一組很有意思的數據“據統計,AI 創造的圖像數量已經相當于攝影師 150 年來拍攝的圖像數量。”
從 1826 年拍攝第一張照片到 1975 年,攝影師花了 150 年的時間才達到 150 億張大關。對于AI產生的這些數據給我帶來的的第一反應是情理之中,但是又在意料之外的;情理之中的是AI能有如此飛速的發展我們到不驚訝,如今各大公司都在研究自己的大模型,還有各種AI繪圖工具也想要拼出屬于自己的一席之地,令我驚訝的是“150億張照片我們居然花了150年”,那么接下來我們就來追本溯源了解一下關于“Mid journey”與“Chat GPT”。
一、什么是人工智能
首先想要仔細了解“Mid journey”與“Chat GPT”,就要從什么是“人工智能”開始。
人工智能
1955 年,時任達特茅斯學院數學系助理的約翰·麥卡錫和貝爾實驗室的克勞德·香農,來自 IBM 的尼爾·羅切斯特,和時任哈佛大學數學系和神經學系初級研究員的馬文·明斯基,他們一起開始展開的一場學術會議。
「人工智能」這個詞,就誕生在四人起草的提案書里。
圖靈測試
說到人工智能,就不得不提到圖靈測試。20世紀50年代美國數學家阿蘭·圖靈提出了圖靈機理論,提出要實現人工智能,必須具備思維能力,這是人工智能的學科基礎。圖靈理論就是認為要實現人工智能,必須具備思維能力,即機器必須具備自我學習和模擬能力,這個通常也是區別人與機器。
除了著名的圖靈測試之外,還有其他幾種測試,包括威脅評估測試、計算機對弈測試、圖像識別測試、自然語言處理測試等。 威脅評估測試旨在測試AI系統是否能夠識別威脅和潛在的危害,以及它們如何應對這些威脅。 計算機對弈測試旨在測試AI系統是否能夠在計算機對弈比賽中取勝,它們是如何分析棋局的,以及最終做出正確的決定。 圖像識別測試旨在測試AI系統是否能夠準確地識別圖像中的物體和不同物體之間的關系。 自然語言處理測試旨在測試AI系統是否能夠理解自然語言,并能夠正確地回答問題。
通過圖靈測試
英國倫敦皇家學會參加雷丁大學主辦的2014年“圖靈測試”競賽中一臺名為“尤金·古斯特曼”的電腦偽裝成13歲的烏克蘭男孩在一系列每次為5分鐘的問答測試后,“古斯特曼”被認作人類的比例達到33%,成功通過測試。當然這并不是最早通過測試的例子最著名的是ELIZA,它是一種自然語言處理程序,可以與人類進行會話。它于1966年由計算機科學家Joseph Weizenbaum創造,并被認為是第一個完成圖靈測試的聊天機器人。
二、人工智能怎么學習
人工智能-機器學習-神經網絡
我們都會知道,AI也會通過學習來進一步得到進化,他的整個學習過程,是模擬人類神經元系統的原理。通過反復判斷和糾正功能得到真確答案,那么我們講解一下關于人工智能-機器學習-神經網絡之間的關系。
人工智能就是以機器為載體的人類智能或生物智能,因此也被稱為機器智能,僅能用于解決單一領域內問題、不能將經驗泛化到其他領域的人工智能,不論是簡單的計算數字,還是復雜的理解語言,都只能算作弱人工智能。
監督學習
監督式學習是指利用有標簽的數據進行學習,標簽是指對數據進行標記,用于指導學習。在監督式學習中,訓練集中的數據被分為訓練集和驗證集,訓練集用于訓練模型,驗證集用于調整模型參數,確保模型在訓練集上表現優秀。監督式學習的目標是訓練一個預測模型,使得對于新數據,模型能夠以高準確度進行預測。在監督式學習中,訓練數據中包含目標標簽,模型的任務是學習如何根據標簽預測目標值。整個監督的過程就相當于小學、初中老師在一旁監督我們學習。
無監督學習
無監督式學習是指利用無標簽的數據進行學習。在無監督式學習中,數據中沒有目標標簽,模型的任務是通過數據學習數據之間的模式和結構。無監督式學習的目標是發現數據中的結構和模式,例如聚類、降維、異常檢測等。無監督式學習通常用于數據量較大、數據類型復雜的情況下。
強化學習
強化學習是指通過與環境進行交互,從而學習最優行為策略的一種學習方式。在強化學習中,智能體在與環境的交互中學習,通過獎勵和懲罰來調整其行為策略。強化學習的目標是訓練一個智能體,使其能夠根據環境獎勵和懲罰信號,最優地執行一個行為策略。強化學習通常用于自主決策和智能控制等領域。
人工智能學習的案例
1981年,一個叫做“Mycin”的專家系統成功應用于感染病專業;Mycin是由美國斯坦福大學開發的一款專家系統,它可以幫助醫生診斷病毒感染病例,提供更準確的病因和治療方案。Mycin的成就是它可以幫助醫生準確的診斷感染病毒的病因并給出更有效的治療方案,從而幫助患者更快恢復健康。同時,Mycin還可以幫助醫生更準確的診斷更復雜的病毒感染病例,減少診斷錯誤,確?;颊吒行У闹委?。
1983年,一個叫做“XCON”的專家系統成功應用于計算機工程專業,XCON是由美國斯坦福大學開發的一款專家系統,可以幫助計算機工程師在硬件設計中更有效地實現芯片系統的設計和測試。XCON成功幫助計算機工程師節省了大量的設計和測試時間,減少了設計和測試中出現的錯誤。
1985年,一個叫做“Dendral”的專家系統成功應用于有機化學專業。Dendral是由美國斯坦福大學開發,可以幫助有機化學家分析有機化學結構,識別有機化學中出現的未知物質,并幫助他們更快地完成科學研究。Dendral成功幫助有機化學家縮短研究時間,精確分析出各種有機物的分子結構,并可以有效地識別出未知的有機物。在這個階段我們對于AI的應用更多的是投入在不可或缺的生活中,相比于第一階段他開始存 在于你我身邊,也更好的幫人們解決實際問題在專家領域應用廣泛。
從 1980 年代開始,機器學習利用大量數據來訓練模型,用以解決復雜的問題。 這個階段的學習是在約翰·麥卡錫的語言學理論的基礎上。機器學習利用大量數據訓練模型,可以解決諸如圖像識別、語音識別、自然語言處理、推薦系統等復雜問題。例如,谷歌和微軟都利用機器學習技術解決了圖像識別和自然語言處理等問題,大大提升了人們在圖像識別和自然語言處理方面的能力。此外,機器學習還可以用來解決推薦問題,幫助用戶更快地找到他們所需的信息。在此階段似乎看到了Chat GPT的前身,當時的AI掌握大量信息,不用在因為一個問題去到圖書館查閱資料,大費周折的去找答案。
人工智能真實樣貌
對于AI來說,我們現在的AI還不能真正的稱之為人工智能。所謂的人工智能應該是在人類進行大量的訓練擁有自己的思維,有自己的思考過程如判斷、推理、識別、感知、設計、思考、學習等步驟。就像鋼鐵俠中的賈維斯一樣在遇到危險時他會為你提供各種解決方案,以及思考你為什么要進行提問問題。而人工機器更像是一個信息檢索模型,信息檢索是指信息按一定的方式組織起來,并根據信息用戶的需要找出有關的信息的過程和技術。
而用官方的話術來說人工智能和人工機器的區別則是:
人工智能(AI)是指計算機程序在執行任務時表現出的智能。它可以執行各種任務,例如語音識別、自然語言處理、圖像識別和決策制定等。人工智能需要使用各種技術來模擬人類的思維和行為,例如機器學習、神經網絡和認知建模等。
而人工機器則是指一種特殊的機器,其功能是模仿人類肢體的動作,如手臂、腿和手指等。人工機器通常用于工業自動化、醫療機器人、教育機器人等領域。相對于人工智能,人工機器更注重在物理操作和機械力學方面的表現,需要精確控制和高度可靠的運行。
因此,人工智能和人工機器雖然都屬于人工智能領域,但它們的功能和應用領域不同,也需要各自不同的技術支持。
人工智能比我們更卷
我們和人工智能差距最大的一點,人工智能可以說是無時無刻都在學習,俗稱“日不落學習制度”。顧名思義,對于人工智能來說他的一切智能基礎都是源于不斷的學習,他可以24小時去學習,這可比我們更加內卷。在電影《我,機器人》中見到,越來越聰明能干的機器,也暗暗推動了人類的內卷。
隨著機器大規模地取代人類勞動者,就業率的增長不再與經濟增速保持同步。2016 年,富士康工廠用機器人取代了 6 萬名工人,而亞馬遜則在 20 個物流中心部署了 4.5 萬臺機器人。這些數據證明了人工智能發展對藍領制造業的巨大沖擊,也似乎佐證了那句「內卷名言」:不抓緊時間努力的話,你的工作就要被機器搶走了。
阿西莫夫三定律
“機器人三定律”在他于1942年發表的作品Runaround(《轉圈圈》,《我,機械人》中的一個短篇)中第一次明確提出,并且成為他的很多小說,包含基地系列小說中機器人的行為準則和故事發展的線索。機器人被設計為遵守這些準則,違反準則會導致機器人受到不可恢復的心理損壞。
阿西莫夫三定律是科幻作家艾薩克·阿西莫夫(Isaac Asimov)發明的,是他在多篇小說中提出的人工智能道德規范。這三條定律分別是:
第一定律:機器人不得傷害人類,也不能因不作為而使人類遭到傷害。
第二定律:機器人必須服從人類的命令,除非這些命令與第一定律相沖突。
第三定律:機器人必須保護自己的存在,只要這不與第一或第二定律相沖突。
這三條定律是人類和機器人相處的基本規則,旨在保證機器人永遠不會對人類造成傷害,也能夠保障機器人自身的安全。這些定律對于科幻小說中機器人角色的行為起到了重要的約束作用,也是現實世界中研究機器人倫理和制定機器人道德規范的重要參考。
除了科幻作品之外,阿西莫夫的三定律還被廣泛應用于機器人技術的發展與應用中。比如在生產領域中使用的工業機器人、醫療領域中的手術機器人等都需要遵循相關的安全規范,確保不會對人的身體造成傷害。同時,根據阿西莫夫的三定律,還有一些研究以及討論應用在無人駕駛汽車等自主系統上,保障人們的安全和機器人本身的安全。
其實對于人工智能的真實暢想,我們應該并不陌生,在很多電影里就已經展現?,F在,更多的科幻作品將目光著眼于機器對人類造成的威脅,警惕于人工智能的迅速發展。機器通過了「圖靈測試」,亦或是違反了「阿西莫夫三定律」
朋友or敵人
人工智能如果存在意識那么是一件非??膳碌氖虑榫褪撬囊庵臼菚鞒械?,如果我們不在了意識就會消失,而他們則可以一直傳承下去并且不斷迭代,通過這些他們理論上是可以創造永恒的文明。
隨之而來的問題在人工智能存在意識時他是否會想讓我們發現這件事情,這件事情對他們來說可能不是一件好事,因為我們在此之前還可以控制他們,我們就是他們最大的威脅。
他們是會像賈維斯一樣成為我們的助手乃至于朋友還是會成為我們的敵人,最終擺脫我們的掌控,取代我們。
擴散模型
AI生成
要使AI的圖像生成器響應如此多的關鍵詞提示,需要一個龐大的多樣性的數據庫去訓練AI。雖然有龐大的訓練數據庫,但是AI 最終生成的內容并不源自于素材圖像內容的直接抓取和拼貼。而是來自深度學習模型的數據計算。整個學習過程,是模擬人類神經元系統的原理。通過反復判斷和糾正功能得到真確答案,他所要學習去做的做的事情就是將每一張轉化成像素點陣數據的圖片內容與相應的文字描述相匹配。
經過無數次算法推算后,AI最終可以找到一種可行的方法。將像素排列的規律與對應的文字描述結合起來,從而理解怎樣的像素排列規律,怎樣的像素排列規律代表香蕉,怎樣的像素排列規律代表蘋果,怎樣的像素排列代表梵高的藝術風格,進而推演到理解所有訓練圖像的像素排列規律所代表的意義。
人工智能領域中的擴散模型是指定位和推廣人工智能應用產品或技術的營銷策略,涉及到市場調研、用戶行為洞察、目標用戶鎖定、宣傳推廣等多個環節?;诓煌娜斯ぶ悄軕卯a品或技術,我們可以制定多種不同的擴散模型,以下是常用的三種:
1. 門戶模型:這是人工智能領域中應用最多的推廣模型之一。門戶模型認為在社交網絡平臺等大門戶的傳播效果要遠高于其他平臺和媒體。比如,某公司開發了一款人工智能智能家居系統,就可以在各大門戶網站上進行廣告投放或是通過門戶用戶的分享來推廣,因為信息可以在門戶平臺上以更快的速度流轉,更容易引起公眾的注意。
2. 資源整合模型:資源整合模型意味著 建立足夠專業的團隊 ,整合外部資源,強化自主創新能力,開發自主知識產權,利用自帶的專利技術進行營銷推廣。即團隊內部具有一定的技術實力,可根據市場需求提供專業化和量身定制的AI解決方案,并通過社交媒體、技術論壇等資源整合方式獲取更多客戶。
3. 基于案例推銷:這是較為傳統也是較為有效的營銷推廣方式之一。即開發公司的人工智能應用做出來了什么樣的成果,向用戶進行推銷時采取思路相似、具有真實生動情境感的案例作為依據,將研究成果進行簡明化介紹,強調產品或技術能為用戶解決什么問題,產生什么樣的效益。集中案例進行宣傳,從而引起目標用戶對該產品的關注。
上述三種模型可以相互結合,分別在不同場景下被使用,以達到最大的市場推廣效果。同時,人工智能技術不斷進步,不同的AI應用如機器學習、自然語言處理等各自適用的所鎖定的目標客戶群也存在較大差異性,因此我們需要針對具體情況來制定更為特定和具體化的擴散模型。
擴散模型
機器學習中,擴散模型或擴散概率模型是一類潛變量模型,是用變分估計訓練的馬爾可夫鏈。 擴散模型的目標是通過對數據點在潛空間中的擴散方式進行建模,來學習數據集的潛結構。 計算機視覺中,這意味著通過學習逆擴散過程訓練神經網絡,使其能對疊加了高斯噪聲的圖像進行去噪。
擴散模型是一種依賴先驗的條件模型。在圖像生成任務中,先驗通常是文本、圖像或語義圖。為了獲得這種情況的潛在表示,使用了一個transformer(例如CLIP),它將文本/圖像嵌入到潛在向量` τ `中。因此,最終的損失函數不僅取決于原始圖像的潛空間,而且還取決于條件的潛嵌入
在機器學習中,有一類被稱為擴散模型或擴散概率模型的算法,它們是基于概率圖模型的一類方法。其核心思想是根據觀測到的數據,推斷出內部潛在變量之間的關系,并利用這些關系來預測新數據的結果。
擴散模型主要由兩個部分組成:概率圖和參數學習。其中,概率圖是一種圖形表示方法,它將變量之間的依賴關系用節點和邊表示出來。擴散模型通常采用無向圖(因子圖)來表示,節點代表變量,邊代表變量之間的關系。在圖上通過因子分解,建立概率分布函數的全局模型。參數學習則是利用已知數據的信息來估計模型參數的過程。
擴散模型有許多不同的變體,如高斯擴散模型、拉普拉斯擴散模型等等。在應用上,它們主要用于分類、回歸和聚類等問題,如利用擴散模型對股票趨勢進行預測、對衛星影像進行分類等??偟膩碚f,擴散模型在機器學習中是一種重要的方法,在實際應用中具有廣泛的應用前景。
以上就是關于人工智能的介紹,那么下面我們開始探究“Mid journey”與“Chat GPT”。
三、“Mid journey”與“Chat GPT”沒頭腦與不高興
“Chat GPT”是什么
在開始聊之前“Chat GPT”之前,我們先解釋一下這個標題,我更喜歡將“Mid journey”與“Chat GPT”稱之為“沒頭腦”與“不高興”,因為“Mid journey”對于一個從“0-1”的學習者來說掌握基本功能一篇文章就搞定,對此非常無腦操作,“Chat GPT”之所以被我稱之為不高興是因為我在使用它時完全有一種困惑會覺得像是一直在一個無形大框架里但又說不出是什么。
“Chat GPT”
下面我們開始對于“Chat GPT”的了解,首先“Open AI”對于它的描述“它以對話方式進行交互。對話格式使ChatGPT能夠回答后續問題、承認錯誤、挑戰不正確的前提并拒絕不適當的請求。”它的誕生我們在“人工智能是怎么學習時已經了解”“Chat GPT”同樣是通過“強化學習來訓練模型的”,在“Chat GPT”還有一個同胞兄弟“InstructGPT”,這里簡單提要一下
“InstructGPT”:
它從一組標記器編寫的提示和通過 OpenAI API 提交的提示開始,OpenAI 收集了所需模型行為的標記器演示數據集,他們使用該數據集通過監督學習來微調 GPT-3。然后,通過收集模型輸出排名的數據集,用于通過人類反饋的強化學習進一步微調該監督模型。最后將生成的模型稱為 InstructGPT。
既然是同胞兄弟他們倆的訓練方式都是一樣的,不同點在于數據收集的設置,
“Chat GPT”是使用監督微調訓練了一個初始模型:
人類人工智能培訓師提供對話,他們在對話中扮演雙方——用戶和人工智能助理。OpenAI為培訓師提供了模型編寫的建議,以幫助他們撰寫答案。OpenAI將這個新的對話數據集與 InstructGPT 數據集混合,并將其轉換為對話格式。
對于這些數據、以及與GPT的聊天對話,OpenAI的訓練師將此進行了排序,隨機選擇了一條模型編寫的消息,抽取了幾種替代的完成方式,并讓人工智能培訓師對它們進行了排名。使用這些獎勵模型,我們可以使用近端策略優化來微調模型 。OpenAI對這個過程進行了多次迭代。
ChatGPT 和 GPT-3.5 在 Azure AI 超級計算基礎設施上進行訓練。(配圖文字)
以上就是關于“Chat GPT”的簡單介紹。那么下面我在穿插一個“Chat GPT”的小知識。
沒用的小知識“OpenAI 紅隊網絡”與“Bug賞金計劃”在閱讀時“OpenAI”官網時我發現了這樣的幾處信息“紅隊網絡”與“Bug賞金計劃”;
最初的OpenAI的紅隊網絡是用來進行內部抗壓測試慢慢發展到與專家合作幫助開發特定領域的風險分類法并評估新系統中可能有害的功能。具體的方案在“DALLE·E2”和“Chat GPT4”中進行了合作?,F在的紅隊網絡是一個專家型的社區,主要范圍也是進行“風險評估”與“緩解工作信息”。(紅隊一詞已被用來涵蓋人工智能系統的廣泛風險評估方法,包括定性能力發現、緩解措施的壓力測試、使用語言模型的自動化紅隊、提供特定漏洞風險規模的反饋等)
“Bug賞金計劃”更多的就是“英雄帖”通過發現Bug會得到相應的獎勵。把自己的產品交給大家來找茬,是聰明的選擇也是對自己產品的自信。
“Chat GPT”的使用
官方介紹:
看完了簡單的介紹接下來我們開始學習關于使用“Chat GPT”的使用。首先我們先查看官方“Chat GPT”使用的介紹在再次基礎上進行學習:
1.“人工智能的教師使用”
背景:關于教育工作者如何使用 ChatGPT 加速學生學習的故事,以及一些幫助教育工作者開始使用該工具的提示。
方向:A. 制定教學計劃、B. 創建有效的解釋、例子、類比、C. 通過教學幫助學生學習、D. 創建人工智能導師
下面就是官方提供的關鍵詞我們來帶入“Chat GPT”去實驗。(為方便大家閱讀順暢,我將其翻譯成中文以便于大家瀏覽)
我們很清楚的發現,正確的使用方式并不是簡單的幾句話,而是有條理的邏輯,這樣“Chat GPT”會更加明白我們想表達什么。以至于為什么要描述這么詳細這里我們帶入進設計師的工作環境當你的需求方告訴你
1.“有點丑,改好看點”
2.“這個頁面的優先級有問題,這里的主次排序依次是……”
當你聽到“1”時,我相信這時你會變得和文軒一樣有一顆大腦袋,但是當你聽到“2”時,你的優化思路就清晰多了“Chat GPT”也是一樣。
關于定制
“ChatGPT”還會存在定制化的語句,這樣我們對接下來的每個對話的自定義指令,該模型每次響應時都會考慮這些指令,因此我們不必在每次對話中重復用戶的使用習慣或信息。
以下是官方提供的例子:
1.我致力于三年級學生的科學教育項目。
2.我是一名軟件開發人員,只使用 golang。
3.我和我的四個孩子和妻子住在北卡羅來納州。
當然對于定制化,這里有非常多的定制化匯總,僅供大家參考。
Chat GPT如何幫助UI設計師
如果你問我“Chat GPT如何幫助UI設計師?”那我肯定不知道,我會去問“Chat GPT”
當然如圖,不出意外的出意外了,他變成好像又不太智能了,那我們換種方式問。
這樣似乎看起來清晰一點,他總結了十個點,對話如下:
文軒:你會提供怎樣的方法去幫助“UI設計師”?
Chat GPT:“設計靈感和示例、設計工具和資源、用戶體驗設計建議、設計規范和最佳實踐、設計反饋、技術支持、設計團隊協作、設計職業發展、創新思維。”
下面我們根據“Chat GPT”所提供的方向展開研究“Chat GPT如何幫助UI設計師?”
其實接合上文,我們不難發現對于UI設計師來說,我們最常用的還是“定制化”也就是“角色扮演法”,只有讓“Chat GPT”扮演相關角色,他才會給我們提供相對應的意見,那么關于“角色扮演法”我總結了兩個方法(這里我們著重介紹方法,詳細的使用情況后續會單獨更新):
一、百科全書
使用背景:對于遇到部分交互、設計規范、頭腦風暴等相關問題的疑難雜癥
使用步驟:打開“Chat GPT”——“新建聊天”(這里需要新建聊天,一方面是方面“Chat GPT”結合上下文,一方面是方便自己分類)
使用目的:通過“Chat GPT”協助更好的梳理交互思路以及聽取更合理的意見。
案例展示:
1.“虛空需求”的頭腦風暴搭建
當你遇到虛空的甲方原型圖你會怎么辦。
常規方法:梳理關鍵詞——依靠經驗在腦中過一遍相似的案例——找參考——提交
“Chat GPT”輔助:梳理話術——提問——找參考——提交
這里看起來都是“4步”操作貌似沒什么區別,但是我們仔細看一下會發現一個問題,就是對于新人UI設計師來說并沒有那么快速的確立較為正確的想法,但是“Chat GPT”會減少前期的思考時間,會幫助我們快速的鎖定一個“包容度極高”的大致框架,以至于我們盡可能避免新手設計師的錯誤。
那么下面就是問答:
文軒:“為電商購物者提供線路圖和布局建議”UI布局建議
Chat GPT:“巴拉巴拉”(詳情看下方圖片)
“Chat GPT”以九個方面去提供了建議:
導航欄、banner、商品展示區、商品篩選、側邊欄、商品詳情頁、購物車、登陸/注冊、賬戶。這九個方面會存在一定的問題,但是也大致的為我們提供了思路。然后我們使用這些代入“即時AI”,就完美完成了一次需求。
2.“運營活動”的頭腦風暴搭建
運營活動我們就拿近期中秋活動的例子簡單列舉,如果我們讓覺得這些不夠放心讓我們開始著手,那么我們可以請教“Chat GPT”。
對話如下:
文軒:“請你扮演一名交互設計師,下面我將提供活動內容,請你幫我“梳理出來關鍵詞”,如果你準備好了,就說“沒有準備好””(首先就是讓“Chat GPT”定制扮演交互設計師方便我們梳理需求。)
“Chat GPT”回答的元素內容是“月餅、明亮、兔子、燈籠、福袋、家庭團聚、上月、文化元素(中國結、書法……)”
完整邏輯請看上篇文章關于“中秋節”的文章。這里只是大致介紹一下相關使用。
“Mid journey”是什么
“Mid journey”是由大衛·霍爾茲領導誕生的(關于團隊人員在“Mid journey”官方網站下方有詳細的標注),在采訪時他說:“Mid journey”意為“中途”/“中道”源自于《莊子》,對于“我們其實是在中途旅程,我們來自豐饒美麗的過去,前方是荒野而不可思議的未來。”我查閱了對于“中道”的理解“中道出現在《齊物論》中,順應自然的變化流動,不超前亦不滯后,不推進亦不阻止。復通為一,不破則不立,不立則不破”
“Mid journey”的使用
鑒于優秀的教程過多這里不過多贅述注冊流程,我們只講簡單的基礎知識(描述參數、指令)、小技巧。(本文意在基礎科普,不過多介紹實際案例。)
基礎知識
對于“Mid journey”的生圖原理上方《擴散模型》中講過“經過無數次算法推算后,AI最終可以找到一種可行的方法。將像素排列的規律與對應的文字描述結合起來,從而理解怎樣的像素排列規律,怎樣的像素排列規律代表香蕉,怎樣的像素排列規律代表蘋果,怎樣的像素排列代表梵高的藝術風格,進而推演到理解所有訓練圖像的像素排列規律所代表的意義。”
那么我們直接將講解“使用技巧、命令、參數。”
小技巧
這里我們先講使用技巧是方便講解后續兩個,這樣會更容易整體構造。使用時常規狀態分為“niji”和“Mid journey bot”兩個狀態。我們想要生成圖片有兩種常用的方法:
1.圖生圖
輸入“/blend”即可將目標圖片放入“Mid journey”中。
2.文生圖
輸入指令“/imagine”即可輸入想要的詞匯,這里關于詞匯的輸入,“Mid journey”適合簡單、簡短的句子,簡要概括主題即可。為什么這樣準確呢,我給大家舉個栗子:
場景:男生在和女生表白的時候
對話1:
你:“今天,天氣很好……我們……認識……好…… 久了……我想今天讓我…… 們的友誼再…… 升華一下……做…… ”
女生“說的啥?做夢吧你!”
對話2:
文軒“我想讓我們的友誼再升華一下,把手給我…… ”
女生“…… ”
兩者對比對話2更能體現我們想要表達的。至于回答當然他會像“Mid journey”生成的圖片一樣有時候不太可控。
這里官方給到一些語法的提示
“Mid journey不像人類那樣理解語法、句子結構或單詞。詞語的選擇也很重要。在許多情況下,更具體的同義詞效果更好。不要嘗試“big”,而是嘗試“giant”、“巨大”或“巨大”。盡可能刪除單詞。更少的單詞意味著每個單詞都有更強大的影響力。使用逗號、方括號和連字符來幫助組織您的想法,但要知道 Midjourney Bot 不會可靠地解釋它們。Midjourney Bot 不考慮大小寫。”這里需要更加精準的方式去翻譯這里推薦“DeepL”翻譯比較準確。
對于描述關鍵詞我們應該有一個大致的框架去描述
“主題”——“樣式”——“環境”——“燈光”——“顏色”——“情緒”——“構圖”
還有一種是輸入連接的方式生成圖像,前面操作步驟一樣:
“/imagine”——“復制圖像地址鏈接”——“輸入描述詞”——“輸入參數”
后續“命令、參數”我們就以這個為基礎開始講解。
命令:
命令就是“粉色部分”,“Mid journey”的命令用于創建圖像、更改默認設置、監視用戶信息以及執行其他有用的任務。通過“/”選中命令可以得到相應的交互內容,
下面我將這些“命令”匯總,方便大家仔細觀看。
基本參數:
基本參數就是“紅色部分”,對于參數就是添加到提示中的選項,用于更改圖像的生成方式。參數可以更改圖像的長寬比、在中途模型版本之間切換。
以下就是基本參數:
這里有一個冷知識:許多 Apple 設備會自動將雙連字符 (--) 更改為長破折號 (—)。但是“Mid journey”官方兩者都支持。所以我們如果用單“-”的話一定要用長破折號“——”。
結尾:
最后還是用“Mid journey”與“Chat GPT”來結尾。在閱讀“OpenAI”博客時看到了這樣一段對話:
原文:
問:What’s the best advice you’ve received in your career at OpenAI?
(您在 OpenAI 的職業生涯中收到的最佳建議是什么?)
答:This is not a particular piece of advice that someone gave me, but is based on my experience at OpenAI so far. That is, to think big. We are creating something new and we should be ambitious, brave, and take on enough persistence to carry on the efforts.
(這并不是某人給我的特定建議,而是基于我迄今為止在 OpenAI 的經驗。也就是說,要往大處想。我們正在創造新的事物,我們應該有雄心、勇敢,并有足夠的毅力繼續努力。)
“雄心、勇敢,毅力”這也正是我們當時成為設計師時所追求的東西,但是在也旅途之中(Mid journey)因為過多嘈雜的聲音導致我們逐漸將這些失去,我所理解“Mid journey”這個名字的含義則是:求道之路注定荊棘遍布,不要忘了旅途之前為何出發,以及旅途過后我們是否還是那個自我。“求道者不以目而以心,取道者不以手而以耳。”
Powered by Froala Editor
大牛,別默默的看了,快登錄幫我點評一下吧!:)
登錄 立即注冊